Machine Learning y el Mercado Accionario
De acuerdo a Ramasubramanian & Singh (2019), el primer programa computacional capaz de aprender fue “The Samuel Checkers-Playing Program”, el cual fue desarrollado por Arthur Lee Samuel, uno de los padres del aprendizaje automático, en inglés Machine Learning (ML). Seguido de Samuel, está el trabajo de Ryszard Michalski, el cual creo un sistema para reconocer el código alfanumérico escrito, en conjunto con Jacek Karpinski 1962-1970. Estos trabajos dejaron huella para diversas aplicaciones de negocios futuras.
El aprendizaje automático o ML es un subcampo de las ciencias computacionales y una rama de la Inteligencia Artificial (IA), cuyo objetivo es desarrollar técnicas que permitan que las computadoras aprendan. Un agente aprende cuando su desempeño mejora con la experiencia; o sea, cuando la habilidad no estaba en su genotipo. De manera concreta, los programas deben ser capaces de generalizar comportamientos. Los algoritmos de ML parten de una muestra llamada “Datos de Entrenamiento” (Training Data en inglés), para hacer las predicciones en los “Datos de Prueba” (Test Data en inglés). ML tiene un amplio campo de aplicaciones como filtro de correo electrónico, reconocimiento de discurso, reconocimiento de imágenes, entre otros.
ML se reorganizo como un campo separado de IA y empezó a florecer en los 1990´s, diferenciándose de IA tratando de resolver problemas de naturaleza práctica. Cambió su enfoque simbólico de IA a un enfoque de métodos tomados de la teoría de estadística y probabilidad. Así mismo, Pearl (2018) argumenta que la diferencia entre ML e IA radica en que el primero predice en base a observaciones pasivas, mientras que el segundo implica la existencia de un agente que interactúa con el ambiente para maximizar las probabilidades de tener una predicción exitosa. Así mismo, Fama (1970) define tres distintos tipos de prueba de eficiencia de mercados. i) débil: donde solo se utiliza información histórica de precios accionarios, ii) semi-fuerte: donde se utiliza información pública para predecir el mercado, y iii) fuerte: solo la información privada es útil para predicción.
En estos tiempos está de moda la predicción del mercado accionario con ML, utilizando técnicas tradicionales que van desde regresiones simples hasta algoritmos complejos como lo son las redes neuronales, utilizando criterios de desempeño de pronóstico usuales tales como la raíz del error cuadrático medio (RMSE por sus siglas en inglés) y el promedio del error absoluto (MAPE por sus siglas en inglés). Sin embargo, el tratar de predecir el futuro del mercado de valores sigue siendo una labor muy complicada, por ende, unos colegas investigadores y un servidor nos hemos dado a la tarea de iniciar un proyecto de investigación el cual sea complejo en elaboración, pero sencillo de entender en cuanto a resultados se refiere. En particular vamos a predecir si el precio accionario sube o baja (variables categóricas o dicotómicas), comparando el desempeño de pronóstico de 4 modelos: Bosque Aleatorio, Árbol de Decisiones, Regresión Logística y Potenciación del Gradiente. Próximamente se publicarán los resultados de esta investigación en un journal internacional, los cuales con mucho gusto compartiré si así lo desean.
Referencias
Fama, E. (1970). Comparison of Financial Models for Stock Price Prediction. Journal of Finance. 25(2), 383-417.
Pearl J. 2018, The Book of Why: The New Science of Cause and Effect, Basic Books.
Ramasubramanian & Singh 2019, Machine Learning Using R, APress.
Sobre el autor:
Jaime Gonzalez Maiz Jimenez. Profesor de tiempo completo del departamento de Finanzas y Contaduría de la Universidad de las Américas Puebla.
Contacto: jaime.gonzalezmaiz@udlap.mx