УДК 336.018(045)
DOI: 10.36871/2618-9976.2026.04.004
Авторы
Кан Цзинхань,
Аспирант, Высшая инженерно-экономическая школа, Санкт-Петербургский политехнический университет Петра Великого, СанктПетербург, Россия
Андрей Александрович Зайцев,
Доктор экономических наук, профессор, Высшая инженерно-экономическая школа, Санкт-Петербургский политехнический университет Петра Великого, Санкт-Петербург, Россия
Аннотация
На фондовые рынки влияют экономические условия, политические факторы и другие переменные, при этом их внутренние колебания обычно демонстрируют и линейные, и нелинейные характеристики, а их модели чрезвычайно сложны. Традиционные математические и статистические методы с трудом позволяют точно извлечь ценную информацию из таких колоссальных массивов данных. Модели глубокого обучения, в частности нейронные сети на основе архитектуры Transformer, отлично справляются с задачами прогнозирования, связанными с большими наборами данных и сложными нелинейными соотношениями. Однако при расчёте глобальных корреляций механизм внутреннего внимания Transformer имеет тенденцию распределять внимание по всей последовательности, что может привести к игнорированию некоторых временных, но важных локальных закономерностей. Модель LSTM управляет и передаёт информацию через свой механизм вентилей, а именно – входной вентиль, вентиль забывания и выходной вентиль. Изначально её целью было улучшить учёт локальных особенностей и краткосрочных зависимостей, а также в некоторой степени смягчить проблемы долгосрочных зависимостей. Однако на практике, особенно в сложных последовательностях данных фондового рынка, объём её памяти ограничен. По мере увеличения длины последовательности влияние более ранней информации постепенно ослабевает. Исходя из этого, в настоящей статье предлагается модель TransformerLSTM для одновременного учёта локальных и глобальных характеристик. LSTM превосходно фиксирует локальные временные зависимости, в то время как модель Transformer, опираясь на механизм многоголового внимания, может напрямую моделировать глобальные зависимости, вычисляя относительные веса между любыми двумя временными шагами. Это позволяет лучше прогнозировать тенденции фондового рынка.
Ключевые слова
прогнозирование акций
модели глубокого обучения
нейронная сеть
трансформаторная архитектура
архитектура LSTM
механизм многоголового внимания
Список литературы
[1] Верединский С.Ю., Макаров В.В., Слуцкий М.Г. Цифровые платформы для разработки и реализации инновационных проектов вуза // Журнал правовых и экономических исследований. 2021. № 1. С. 105–110.
[2] Дмитриев Н.Д., Родионов Д.Г., Жильцов С.А. Оптимизация управленческих процессов в электроэнергетике на основе математического моделирования // Kant. 2021. № 1(38). С. 18–23.
[3] Жогова Е.В., Зайцев А.А., Родионов Д.Г. Инструментальные методы оценки региональной промышленной политики // Российский экономический интернетжурнал. 2019. № 2. С. 35.
[4] Родионов Д.Г., Зайцев А.А., Дмитриев Н.Д. Стресстестирование в промышленном производстве: моделирование барьера устойчивости // Вестник Алтайской академии экономики и права. 2020. № 111. С. 119–130.
[5] Стародубов Д.О., Макаров В.В. Управление инновационным развитием корпоративных структур в целях обеспечения их конкурентоспособности // Журнал правовых и экономических исследований. 2020. № 1. С. 88–93.
[6] AlKhasawneh M.A., Raza A., Khan S.U. R. et al. (2025) Stock Market Trend Prediction Using Deep Learning Approach. Comput Econ, 66, 453–484. DOI: https://doi.org/10.1007/ s10614024107141.
[7] Balasubramanian P., Chinthan P., Badarudeen S., Sriraman H. (2024) A systematic literature survey on recent trends in stock market prediction. PeerJ Computer Science, 10:e1700 DOI: https://doi.org/10.7717/peerjcs.1700.
[8] Chin Yang L., Lobo Marques J.A. (2024) Stock market prediction using artificial intelligence: A systematic review of systematic reviews. Social Sciences & Humanities Open, 9: 100864. DOI: https://doi.org/10.1016/j.ssaho.2024.100864.
[9] Chopra R., Deep Sharma G., Pereira V. (2024) Identifying Bulls and bears? A bibliometric review of applying artificial intelligence innovations for stock market prediction. Technovation, 135: 103067. DOI: https://doi.org/10.1016/j.technovation.2024.103067.
[10] Hafshejani M.S., Mansouri N. (2025) Enhancing Stock Market Prediction with LSTM: A Review of Recent Developments and Comparative Analysis. Arch Computat Methods Eng. DOI: https://doi.org/10.1007/s11831025103700.
[11] Hochreiter S., Schmidhuber J. (1997) Long ShortTerm Memory. Neural Computation, 9, 735780. DOI: https://doi.org/10.1162/neco.1997.9.8.1735.
[12] Ko C.R., Chang H.T. (2021) LSTMBased Sentiment Analysis for Stock Price Forecast. PeerJ Computer Science, 7, e408. DOI: https://doi.org/10.7717/peerjcs.408.
[13] Lee H., Kim J.H., Jung H.S. (2024) Deeplearningbased stock market prediction incorporating ESG sentiment and technical indicators. Sci Rep, 14, 10262. DOI: https://doi.org/10.1038/ s41598024611062.
[14] Li A.W., Bastos G.S. (2020) Stock Market Forecasting Using Deep Learning and Technical Analysis: A Systematic Review. IEEE Access, vol. 8, pp. 185232–185242. DOI: 10.1109/ ACCESS.2020.3030226.
[15] Nti I.K., Adekoya A.F., Weyori B.A. (2020) A comprehensive evaluation of ensemble learning for stockmarket prediction. J Big Data, 7, 20. DOI: https://doi.org/10.1186/ s40537 020002995.
[16] Phuoc T., Anh P.T. K., Tam P.H. et al. (2024) Applying machine learning algorithms to predict the stock price trend in the stock market – The case of Vietnam. Humanit Soc Sci Commun, 11, 393. DOI: https://doi.org/10.1057/s4159902402807x.
[17] Tashreef M., et al.(2023) Transformerbased deep learning model for stock price prediction: A case study on Bangladesh stock market. International Journal of Computational Intelligence and Applications, 22.03: 2350013. DOI: https://doi.org/10.1142/S146902682350013X.
[18] Vaswani A., Shazeer N., Parmar N., et al. (2017) Attention Is All You Need. Advances in Neural Information Processing Systems 30. Annual Conference on Neural Information Processing Systems 2017, Long Beach, 4–9 December 2017, 5998–6008.
[19] Xia Xue, Wang Enlai, Li Xiwu. (2024) A review of the application of Transformer in time series forecasting. Information Technology and Informatization, 3: 124–128.
[20] Yilmaz F.M., Yildiztepe E. (2024) Statistical Evaluation of Deep Learning Models for Stock Return Forecasting. Comput Econ, 63, 221–244. DOI: https://doi.org/10.1007/s10614 022103383.
[21] Yu Yong et al. (2019) A review of recurrent neural networks: LSTM cells and network architectures. Neural computation, 31.7: 1235–1270. DOI: https://doi.org/10.1162/neco_ a_01199.

