Библиотека материалов по теме выпускной работы
-
Обработка естественного языка
Авторы: Золушкин Ю.А. Васяева Т.А.
Описание:Разобраны основы обработки естественного языка для текста. Рассмотрены основы выделения признаков из текста, с целью дальнейшего использования их для алгоритмов машинного обучения. Выполнена реализация рассмотренного с применением Python–библиотеки NLTK.
Источник: Материалы XII международной научно–технической конференции в рамках VII международного научного форума Донецкой Народной Республики к 100–летию ДонНТУ. – Донецк: ДонНТУ, 2021. – C. 71–79.
-
Natural Language Pre–Processing For Machine Learning Models
Авторы: Ю.А. Золушкин Т.А. Васяева Н.В. Ревина
Описание:В данной статье рассматривается понятие обработки естественного языка. Выполнен анализ существующих способов обработки естественного языка. Определены их преимущества и недостатки.
Источник:Материалы научно–практической конференции для молодых ученых Young scientists’ researches and achievements in science посвященной 100–летнему юбилею Донецкого национального технического университета. – Донецк: ДонНТУ, 2021. – C. 249–253.
-
Neural Machine Translation for English to Hindi Using GRU
Авторы: P. Shalu, M. Meera
Описание: Языковой перевод помогает людям общаться, обмениваться информацией и устанавливать отношения во всем мире. Нейронный Машинный перевод помогает повысить производительность, поскольку он переводит текст с одного языка на другой. Эта статья генерирует составляет резюме с заголовком, а также сравнивает три нейронных Модели машинного перевода, основанные на различных методах для Попарно англо–хинди: архитектура последовательности с кодировщик и декодер (1) Долговременная память (2) Двунаправленная долгосрочная краткосрочная память (BI–LSTM) с условием Случайное поле (CRF) и (3) закрытые повторяющиеся единицы (ГРУ) с Механизм внимания применяется в трех моделях. Сравнение показал, что ГРУ лучше по производительности, чем LSTM и Bi–LSTM CRF.
Источник: https://easychair.org
-
Translating with Bilingual Topic Knowledge for Neural Machine Translation
Авторы: Xiangpeng Wei, Yue Hu, Luxi Xing, Yipeng Wang, Li Gao
Описание: В этой статье мы предлагаем новую двуязычную модель NMT, расширенную по темам (BLTNMT), чтобы улучшить производительность перевода за счет включения двуязычных тематических знаний в NMT. В частности, двуязычные знания темы включены в скрытые состояния кодера и декодера, а также в механизм внимания.
Источник: https://paper.idea.edu.cn/
-
Pre–Translation for Neural Machine Translation
Авторы:Jan Niehues, Eunah Cho, Thanh–Le Ha and Alex Waibel
Описание:В этой работе мы использовали машинный перевод на основе фраз для предварительного перевода вводимых данных на целевой язык. Затем система нейронного машинного перевода генерирует окончательную гипотезу, используя предварительный перевод.
Источник: https://arxiv.org/
-
Neural Machine Translation as a Novel Approach to Machine Translation
Авторы: Lucia Benkova, Lubomir Benko
Описание:Цель статьи – представить наиболее часто используемую систему машинного перевода и статистического машинного перевода, а также представить новую систему – нейронный машинный перевод.
Источник: https://www.researchgate.net/
-
Машинный Перевод. Нейроперевод
Авторы: Р. Г. Мифтахова, Е. А. Морозкина
Описание: В статье рассмотрен принцип работы нейронных сетей в переводе, методы «обучения» таких сетей, а также различия этих видов перевода. Статья раскрывает такие понятия, как
глубокое обучение
,вес
, «кодирование», «декодирование», «вектор», «уровень», «встраивание слов» (word embeddings) и др.Источник: https://cyberleninka.ru/
-
Современные методы обработки естественного языка
Авторы: Б. О. Близнюк, Л. В. Васильева, И. Д. Стрельников, Д. С. Ткачук
Описание: В данной статье рассмотрены основные проблемы обработки естественного языка. Проанализированы основные направления обработки, методы, инструменты и библиотеки, доступные на текущий момент времени. Проведено два эксперимента, где данные методики были применены для решения реальных задач – анализ тональности новостного фона некоторых криптовалют с целью определения зависимостей между новостным фоном и их обменным курсом и анализ фактов о сотрудничестве компаний, используя их упоминания в различных пресс–релизах. Показано, что анализ текстовых данных имеет большое практическое значение в современном мире.
Источник:http://www.irbis-nbuv.gov.ua/
-
Bridging the Gap between Training and Inference for Neural Machine Translation
Авторы: Wen Zhang, Yang Feng, Qun Liu
Описание: Нейронный машинный перевод (NMT) генерирует цель слова последовательно в способе предсказания следующее слово обусловлено контекстными словами. Во время обучения он предсказывает правду слова как контекст, в то время как при выводе он должен генерировать вся последовательность с нуля. Это несоответствие загружаемого контекста приводит к накоплению ошибок среди перевода. Более того, обучение на уровне слов требует строгого соответствия между сгенерированная последовательность и основная истина последовательность, которая приводит к чрезмерной коррекции по разным но разумные переводы. В этом документе, мы решаем эти проблемы, выбирая контекст слова не только из базовой последовательности истинности, но и также из предсказанной последовательности во время обучения
Источник: https://arxiv.org/
-
Нейронный машинный перевод – это новое слово в искусстве?
Авторы: Шейла Кастильо, Джосс Муркенс, Федерико Гаспари, Ясер Каликсто, Джон Тинсли, Энди Уэйа
Описание: В этой статье обсуждается нейронный машинный перевод (NMT), новая парадигма в области машинного перевода, сравнивается качество систем NMT со статистическим машинным переводом, описываются три исследования с использованием автоматических методов и методов оценки, проводимых человеком. Результаты автоматической оценки, представленные для NMT, очень многообещающие, однако человеческие оценки показывают неоднозначные результаты. Мы сообщаем о повышении беглости речи, но о непоследовательных результатах с точки зрения адекватности и усилий после редактирования. NMT, несомненно, представляет собой шаг вперед в области машинного перевода, но сообществу следует быть осторожным, чтобы не перепродать его.
Источник (англ.): https://core.ac.uk