АВТОРАСПОЗНАВАНИЕ РЕЧИ И ОЦЕНКА ЕГО ПРИМЕНИМОСТИ В АВИАЦИИ НА СОВРЕМЕННОМ ЭТАПЕ

Опубликован 30.09.2025
СОЦИАЛЬНО-ГУМАНИТАРНЫЕ НАУКИ Том 81 № 3 (2025)
Том 81 №3 (2025)
Авторы:
  • СУЮНБАЕВА А.Ж.
  • ШЕЛЕСТЮК Е.В.
PDF

Прогресс компьютерных технологий открывает возможности для автоматической систематизации, обработки и использования корпусных текстов, то есть процесса распознавания языка на уровне естественной коммуникативной речи, с помощью специальных программ. Статья посвящается к применению современных технологий для снижения недопонимания между пилотами и авиадиспетчерами. Исследователи несколько десятилетий изучают и применяют данную технологию. Внедрение технологий автоматического распознавание речи (ASR) и машинного перевода может существенно снизить такие проблемы, повысив безопасность и предотвратив аварии и инциденты. В статье представлен проект эксперимента, которая является сравнением эффективности двух популярных программ по распознаванию устной речи — ChatGPT (https://chatgptchatapp.com) и Speech2Text (https://speech2text.ru) — при обработке текстов на трёх языках: русском, английском и казахском. Проводимое исследование охватывало разные типы устной речи: формализованная диктовка текста, юридический текст, рассказ на родном языке, а также естественный (спонтанный) диалог между двумя участниками. Анализ проводился как с точки зрения точности транскрипции, так и с учетом особенностей воспроизведения структуры текста, передачи имён собственных, сохранения пауз и разделения речи по спикерам. В состав корпуса входят не только аудиозаписи «чистой» устной речи, но и телефонной речи, что придает программу универсальность. Разработана специальная сложная методика транскрибирования телефонных переговоров, поскольку такая речь часто невнятна, может содержать информацию на других языках, иметь выраженный акцент, содержать различные речевые и неречевые шумы (различные тембры голоса, звуки подготовки говорящего к произнесению следующей мысли, неясные слова, наложение речи нескольких говорящих и т.д.). Эта система преобразует исходный аудиофайл в машиночитаемый формат. То есть, не требует дополнительных компонентов и транскрипций. Данная система представляет собой вариант современных технологий распознавания речи, использующих интегральную модель. Представленная экспериментальная разработка использует технологию распознавания речи, позволяющую понимать голосовые команды, его преимущество перед аналогичными электронными приложениями заключается в том, что он может контролировать беспрепятственный поток информации и ее обработку в экстремальных ситуациях, а также обладает способностью точно воспроизводить естественные диалоги.

СУЮНБАЕВА А.Ж.

Кандидат филологических наук, доцент, Военный институт Сил воздушной обороны, г. Актобе, Казахстан

Е-mail: аltin_suenbaeva@mail.ru, https://orcid.org/0000-0002-0676-2028

ШЕЛЕСТЮК Е.В.

Доктор филологических наук, профессор, Челябинский государственный университет, г. Челябинск, Российская Федерация

Е-mail: shelestiuk@yandex.ru, https://orcid.org/0000-0003-4254-4439

  1. . lderson J. C. The politics of aviation English testing. Language Assessment Quarterly, 2011 8(4), 386-403.
  2. Automatic Speech Recognition for ATC. Sesar Digital Academy: 11/05/2021
  3. Barshi I., Farris C. Misunderstandings in ATC communication. Farnham, UK: Ashgate Publishing Ltd, 2013
  4. Covelli J. M., Rolland J. P., Proctor M., Kincaid J. P., Hancock P. A., Field of view effects on pilot performance in flight. International Journal of Aviation Psychology, 2010, 20 (2), 197-219.
  5. Eurofighter Typhoon, Technology: Cockpit. 2014 URL: http://typhoon.starstreak.net/Eurofighter/cockpit.html. Last accessed: 29 March 2014.
  6. IATA, Pilots and air traffic controllers phraseology study. Montreal: International Air Transport Association, 2011
  7. ICAO, Manual of radiotelephony Doc 9432 AN/925. Montreal: International Civil Aviation Organization, 2007
  8. Jurafsky D., Martin J. H., Speech and language processing: An introduction to natural language processing, computational linguistics, and speech recognition. 2nd international edition. Upper Saddle River, NJ: Pearson Prentice Hall, 2009
  9. LDACS – The future of ATC communications. Canso. 13/01/2023 URL: https://canso.org/ldacs-the-future-of-atc-communications/#
  10. Шелестюк Е.В., Суюнбаева А.Ж., Торайғыров университетінің Хабаршысы, ISSN 2710-3439 Гуманитарлық сериясы. № 4, 2024.
ASR-MT, формальная диктовка, автоматическое распознавание речи, когнитивная нагрузка, идентичность, конвейерные решения

Как цитировать

АВТОРАСПОЗНАВАНИЕ РЕЧИ И ОЦЕНКА ЕГО ПРИМЕНИМОСТИ В АВИАЦИИ НА СОВРЕМЕННОМ ЭТАПЕ. (2025). Научный журнал "Вестник Актюбинского регионального университета имени К. Жубанова", 81(3), 171-184. https://doi.org/10.70239/