DEV Community

Octoparse Español
Octoparse Español

Posted on • Originally published at octoparse.es

Análisis del Mercado de Valores Utilizando Raspado Web

Las empresas de inversión hoy en día están en la carrera de desarrollar algoritmos sofisticados para el comercio de acciones. Ya sea que se trate de la predicción del precio de las acciones, el análisis del sentimiento del mercado de valores o la investigación de acciones, necesitan un gran volumen de datos precisos. Es frecuente que tengan el capital para contratar una tropa de desarrolladores. Para que los investigadores independientes puedan predecir el mercado de valores, existe un método asequible para obtener los datos a escala sin esfuerzo.

En este tutorial, le mostraré cómo extraer datos de stock actualizados para acciones adicionales..

Prerrequisitos:

Este método no requiere codificación. Puede extraer información valiosa de sitios web sin experiencia en tecnología para extraer información valiosa.
Necesitamos usar una herramienta de web scraping tool https://helpcenter.octoparse.es/hc/es/, sería mejor si tienes instalado Octoparse en tu computadora. Mira este video si eres nuevo en la herramienta.

Vamos a sumergirnos en eso.

¡Extraeremos Balance general de las acciones de Bank of America de Yahoo! Las finanzas como ejemplo. Con el Balance general, puede construir una base de datos junto con el precio histórico de las acciones. Con estos datos, podría desarrollar algoritmos/aprendizaje automático que correlacionen los números con los precios de acciónes. Cuando escala el número de existencias, tiene una tubería más grande para entrenar el modelo de su IA.

La URL que vamos a necesitar es https://finance.yahoo.com/quote/BAC/balance-sheet?p=BAC

1) Create a new project:

Click “+ Task” under Advance Mode. Enter the URL into the box and click “Save URL”

This will bring to the Bank of America Stock Market with Octoparse built-in browser.

The data is presented in the form of Table cells. As a result, the bot needs to scrape by table rows. To clarify what I mean, we can open up Chrome developer tools and inspect the website source. The whole table is constructed with

, and consists of multiple s which stands for the data of a row. The data we are going to extract is stored inside each . It makes sense that the bot follows the logic of source code, and extract the information by rows.

1) Crear un nuevo proyecto:

Haga clic en "+ Tarea" en Modo avanzado. Ingrese la URL en el cuadro y haga clic en "Guardar URL"

Esto traerá al mercado de valores del Banco de América con el navegador incorporado Octoparse.

Los datos se presentan en forma de celdas de tabla. Como resultado, el bot necesita raspar por filas de la tabla. Para aclarar lo que quiero decir, podemos abrir las herramientas para desarrolladores de Chrome e inspeccionar la fuente del sitio web. Toda la tabla está construida con


, y consiste en múltiples s que representan los datos de una fila. Los datos que vamos a extraer se almacenan dentro de cada
. Tiene sentido que el bot siga la lógica del código fuente y extraiga la información por filas.

tr

2) A continuación, tenemos que decirle al bot qué información queremos obtener. Haga clic en cualquier número de la celda de la tabla. El bot descubre otros números de la misma columna. Como mencioné anteriormente, debemos seguir la lógica del código fuente y extraer por filas. En este caso, haga clic en "TR" en la parte inferior del Panel de acciones. Ahora Octoparse encuentra la primera fila. ¡Esto es genial! Elija "Seleccionar todo el subelemento", luego elija "Seleccionar todo" para continuar.

select rows

3) Ahora todos los elementos han sido seleccionados con éxito. Elija el comando "Extraer datos en el bucle" para continuar.

4) Ahora terminamos de construir el rastreador! Haga clic en "Iniciar extracción" y elija "Extracción local" para ejecutar la tarea. Tenga en cuenta que "Extracción local" es ejecutar el rastreador en su propia computadora. A diferencia de Cloud Extraction que tiene múltiples extracciones paralelas distribuidas en diferentes servidores, Local Extraction solo grava el recurso local y la velocidad se ve afectada por Internet y el hardware. Es probable que se sobrecargue si tiene tareas simultáneas en ejecución. Por lo tanto, Cloud Extraction es una opción óptima para extracciones a gran escala.

5) Los datos que raspó deberían ser así. Puede elegir un formato preferido para exportar los datos.

stock market

Ahora tenemos Balance General de las acciones de Bank of America de 2015 a 2018, pero ¿cómo puede usarlo en un análisis de mercado?

No soy un experto en inversiones financieras, y este blog no proporciona asesoramiento financiero. Con suerte, puede darte una idea para buscar empresas dignas de inventar.

Cuando se trata de una oportunidad de inversión, es un paso fundamental para analizar el desempeño de una empresa al examinar el balance general. Esto se debe a que un balance general es el estado financiero de los activos, las deudas y el rendimiento de una empresa. Si los activos actuales son mayores que los pasivos, esto significa que la compañía puede cubrir las deudas a corto plazo y es probable que mantenga una posición favorable. Cuando una empresa crece a un ritmo constante a lo largo de los años, es más probable que su inversión esté en buenas manos. Sin embargo, el balance de un banco es mucho más complicado que el de una empresa. La inversión bancaria tiende a ser más riesgosa pero lucrativa. Es razonable controlar el desempeño financiero del banco para una toma de decisiones integral.


Top comments (0)