УДК 004.8.
DOI: 10.36871/ek.up.p.r.2024.12.10.014

Авторы

Нгуен Фук Хау,
Университет электроэнергетики
Бабушкина Наталья Евгеньевна,
Донской государственный технический университет
Эльтаев Саид Исламович,
Грозненский государственный нефтяной технический университет имени академика М. Д. Миллионщикова
Нгуен Тхи Тху,
Университет Шао-До, г Чи Линь, Провинция Хай Зыонг, Вьетнам

Аннотация

статье рассмотрены теоретические практические аспекты анализа неструктурированных данных применением современных методов машинного обучения. Подчёркивается доминирующее положение неструктурированных информационных массивов глобальном цифровом пространстве отмечается, что традиционные реляционные базы данных (RDBMS) не приспособлены для работы подобными данными. статье анализируются источники неструктурированной информации, включая визуальные, текстовые мультимедийные форматы, также роль метаданных объектных хранилищ управлении данными. Рассматриваются современные подходы на основе алгоритмов компьютерного зрения обработки естественного языка (NLP), позволяющие извлекать семантические паттерны, формировать тематические модели интерпретировать сложные поведенческие аспекты. Автор предлагает концептуальную модель, основанную на жестовом анализе, для интерпретации человеческого поведения, иллюстрируя практическое применение рассмотренных методов машинного обучения.

Ключевые слова

неструктурированные данные, машинное обучение, обработка данных, искусственный интеллект, обработка естественного языка (NLP), метаданные, объектное хранилище