Utmn
Electronic Library

     

Details

Ли, Александр Альбертович. Extracting the Semantic Core of Russian Text using Machine Learning Algorithms / Извлечение семантического ядра русскоязычного текста с помощью алгоритмов машинного обучения: выпускная квалификационная работа бакалавра: направление 09.03.03 «Прикладная информатика: информационные технологии и системный анализ» / А. А. Ли; научный руководитель А. Ф. Лысенко; Тюменский государственный университет, Школа перспективных исследований. — Тюмень, 2024. — 1 файл (353 Кб). — Загл. с титул. экрана. — Доступ по паролю из сети Интернет (чтение). — Adobe Acrobat Reader 7.0. — <URL:https://library.utmn.ru/dl/Module_VKR_Tyumen/ShPI/2024/vr24-2799.pdf>. — <URL:https://library.utmn.ru/dl/Module_VKR_Tyumen/ShPI/2024/rev/vr24-2799-z.zip>. — Текст: электронный

Record create date: 9/27/2024

Subject: машинное обучение; семантическое ядро; семантика; оптимизация; machine learning; semantic core; semantics; optimization

Collections: Выпускные квалификационные работы

Links: Приложение

Allowed Actions:

Action 'Read' will be available if you login or access site from another network

Group: Anonymous

Network: Internet

Annotation

Выпускная квалификационная работа (ВКР) посвящена теме «Извлечение семантического ядра русскоязычного текста с помощью алгоритмов машинного обучения». Работа является проектом по заказу цифровой образовательной компании ООО «Лаборатория Мысли», фокусирующейся на групповой деятельности. Работа внедряется в процесс групповой работы, в частности бизнес-игры «Скифская лестница», предоставляя участникам материал для пост-деятельностной рефлексии. Для считывания семантики высказываний были задействованы собранные для обучения уникальные данные компании, существующие инструменты для транскрибации и диаризации речи из аудиофайла и плотные векторные представления Word2Vec, учитывающие контекст реплик. Структура ВКР состоит из введения, основного текста, заключения, приложений, перечня информационных ресурсов и графической части. Эти данные представляют артефакты комплексного подхода к решению задачи, все задействованные инструменты, а также векторное пространство на обученных данных. Содержательная часть ВКР содержит 52 страницы основной работы, среди которых 14 рисунок, 2 таблицы и 3 листа приложений. Перечень использованных информационных ресурсов содержит 14 позиций. К работе приложены 3 листа графического материала.

The final qualification work (FQW) is dedicated to the topic "Extracting the Semantic Core of Russian Text using Machine Learning Algorithms". The work is a project commissioned by the digital educational company LLC "Laboratoriya Mysli", focusing on group activities. The work is implemented in the group work process, particularly in the business game "Scythian Staircase", providing participants with material for post-activity reflection. To detect the semantics of utterances, unique data was collected for training, existing tools for transcribing and diarizing speech from an audio file were utilized, as well as Word2Vec embeddings, considering the context of utterances employed. The structure of the FQW consists of an introduction, main text, conclusion, appendices, a list of references, and a graphic part. These data represent the artifacts of a comprehensive approach to solving the problem, all the involved tools, as well as the vector space on the trained data. The substantive part of the FQW contains 52 pages of the main work, including 14 figures, 2 tables, and 3 pages of appendices. The list of used information resources contains 14 items. 3 sheets of graphical material are attached to the work.

Document access rights

Network User group Action
TumSU All Read
Internet Readers Read
-> Internet Anonymous

Table of Contents

  • 442c62c2a10f654618eac26c999ac105c73f55b0755b70a545476ff834fa950b.pdf
  • Copy of ВКР: SAS

Usage statistics

stat Access count: 1
Last 30 days: 1
Detailed usage statistics