Как переводит компьютер

РефератПомощь в написанииУзнать стоимостьмоей работы

Однако разработка описания морфологии позволяет решить только проблему того, что является заголовком словарной статьи, по которому происходит идентификация единицы текста и единицы словаря. Но ведь идентификация слова из текста со словарной статьей происходит не ради идентификации, как это требуется в электронных словарях, она необходима для выполнения программой собственно процедур перевода… Читать ещё >

Как переводит компьютер (реферат, курсовая, диплом, контрольная)

Во-первых, всем ясно, что чем больше словарь, тем лучше перевод, значит, первая проблема — проблема создания больших словарей для систем.

Во-вторых, ясно, что система должна переводить такие предложения: «Привет, как дела?». Значит, еще одна проблема — научить систему распознавать устойчивые обороты.

В-третьих, понятно, что предложение для перевода пишется по определенным правилам, по определенным правилам переводится, а значит, есть еще одна проблема: записать все эти правила в виде программы. Вот, собственно, и все.

Самое интересное, что эти проблемы действительно являются основными при разработке систем МП, другое дело, что методы их решения известны далеко не всем и отнюдь не так просты, как может показаться.

Системы МП семейства PROMT (PROgrammer's Machine Translation)7 — очень хороший объект, чтобы продемонстрировать, каким образом эти проблемы могут решаться эффективно.

Словарь

Для качественного перевода очень важно, чтобы практически все слова исходного текста легко было найти и в словаре системы. А те из них, которых в нем нет, переносятся в текст непереведенными уже на выходе из системы, и их впоследствии переводят вручную при редактировании результатов перевода. Такие слова могут повлиять на качество перевода предложения. Дело в том, что для определения, к какой части речи относится рассматриваемое слово, система производит анализ всего предложения в целом. При этом имитируется мыслительная деятельность человека (такую систему принято называть системой с элементами искусственного интеллекта). Если значение хотя бы одного слова в предложении не определено, то это может исказить анализ всего предложения, а иногда и результаты всего перевода.

Методы организации больших баз данных достаточно хорошо разработаны, но для перевода не менее, а может быть, и более важно правильно структурировать информацию, которая приписывается элементу базы, правильно выбрать этот самый элемент. Сколько, например, записей в словаре должно соответствовать обыкновенному русскому слову «программа»? И, вообще, большой словарь — это словарь, который содержит много словарных статей, или словарь, который позволяет распознать много слов из текста?

При ближайшем рассмотрении оказывается, что, например, существительные в русском языке изменяются по падежам и по числам, то есть для одного существительного может существовать до 12 разных форм, а для глаголов и прилагательных, как правило, существует еще большее количество различных форм (более тридцати). Следовательно, чтобы переводить предложения, содержащие слова «программу», «программе», «программы» и т. д., хорошо было бы иметь способ соотнесения словарной статьи из автоматического словаря для слова «программа» с соответствующей словоформой из текста. Поэтому для описания и входного, и выходного языка в системе должен существовать некоторый формальный метод описания морфологии, на котором основывается выбор единицы словаря.

В системах семейства PROMT разработано практически уникальное по полноте морфологическое описание для всех языков, с которыми системы умеют обращаться. Оно содержит 800 типов словоизменений для русского языка, более 300 типов как для немецкого, так и для французского языка, и даже для английского, который не принадлежит к флективным языкам, выделено более 250 типов словоизменений. Множество окончаний для каждого языка хранится в виде древесных структур, что обеспечивает не только эффективный способ хранения, но и эффективный алгоритм морфологического анализа.

Кроме того, используемая модель морфологии позволила разработать экспертную систему для пользователя — создателя словаря. Эта система фактически автоматизирует процедуру выделения основы и определения типа словоизменения при вводе новых словарных статей.

Показать весь текст

Заполнить форму текущей работой

Другие работы

Идентификация субъектов и объектов доступа

Мандатный, который состоит в следующем. Вся информация в зависимости от степени секретности делится на уровни, а все пользователи сети — на группы, образующие иерархию в соответствии с уровнем допуска к этой информации. Такой подход используется, например, при делении информации на предназначенную для служебного пользования, секретную, совершенно секретную. При этом пользователи в зависимости…

Реферат

Подробнее...

Конфигурирование безопасности на коммутаторе

Третья строка распечатки показывает режим реагирования системы на нарушения безопасности, который по умолчанию установлен в состояние «Выключение» (Shutdown). Нарушение безопасности происходит, В когда станция, чей МАС-адрес отсутствует в таблице коммутации, пытается получить доступ к интерфейсу. При этом порт немедленно выключается и формируется сообщение о нарушении безопасности. СуществуютВ…

Реферат

Подробнее...

Визуальное моделированиев проектировании ИС

Интерфейс пользователя (GUI) есть главный фактор. Нет смысла заставлять пользователя рисовать картинки. RAD-технология дает возможность продемонстрировать интерфейс в прототипе, причем достаточно скоро после начала проекта. Использование методовавтоматического проектирования ивизуального моделирования позволяет значительно улучшить качество, сократить стоимость и время разработки ИС. В настоящее…

Реферат

Подробнее...

Сегмент иерархической модели данных

Между экземплярами сегментов также существуют иерархические связи. Рассмотрим, например, иерархический граф, представленный на рис. 2.3. Каждый логически подчиненный сегмент может быть связан только с одним логически исходным (родительским) сегментом. Каждый логически исходный сегмент может быть связан с произвольным числом логически подчиненных сегментов; Как видно из примера, физические записи…

Реферат

Подробнее...

Разработка представлений для отображения результатов выборки

SELECT naz_proizvod FROM proizvoditeli WHERE EXISTS (SELECT * FROM tovari WHERE proizvoditeli.`id_proizvoditel`=tovari.`id_proizvod`)). На рисунке представлено товары которые произведено в фирме «Persia». Листинг 2.10. SQL-код для создания представлений. Листинг 2.9. SQL-код для создания представлений. Рис 2.14. Результат представления «no exsist». Рис 2.13. Результат представления «Iran». CREATE…

Реферат

Подробнее...

Заключение. Негативное влияние компьютера на организм человека

Итак, я провела исследовательскую работу с целью узнать, как влияют компьютеры на здоровые человека. Я узнала много нового и поняла то, что, не смотря ни не что, человек не сможет отказаться от помощи компьютера в будущем. Компьютеры будут видоизменяться, становиться более безопасными и удобными чем современные. Но пока компьютер приносит значительный вред нашему организму надо принять все меры…

Реферат

Подробнее...

Заключение. Понятие системы автоматизированного землеустроительного проектирования, ее цель и объект автоматизации

Федеральный закон «О государственной регистрации прав на недвижимое имущество и сделок с ним» от 21 июля 1997 г. № 122 — ФЗ. Федеральный закон «О крестьянском (фермерском) хозяйстве» от 11 июня 2003 г. № 74-ФЗ// Российская газета. — 2003. Гражданский кодекс Российской Федерации от 30 ноября 1994 г. № 51 — ФЗ. — М.: Юридическая литература, 2007 г. Кодекс Российской Федерации об административных…

Реферат

Подробнее...

Защита информации. Информация: понятие, свойства, передача, защита

Организационный контроль эффективности защиты информации — контроль путем проверки соответствия состояния организации, наличия документов, полноты и обоснованности мероприятий по защите информации требованиям организационно-распорядительных и нормативных документов. информационный компьютер программа. Организационные мероприятия по защите информации — мероприятия по защите информации…

Реферат

Подробнее...

Разработка информационной системы атп

На первой стадии запускаются рабочие места, обеспечивающие систему нормативно — справочной информацией, на второй стадии — текущей (первичной) информацией, на третьей стадии — формирующиеся выходные формы. Во-первых, при реализации комплексной системы предприятия необходимо запустить АРМ отдела кадров, АРМ технического отдела, поскольку без сведений о подвижном составе, водителях и другом…

Реферат

Подробнее...

Перспективы развития мини-отелей в Санкт-Петербурге

Но, планируя открыть мини-отель, нужно понимать, что сегодня малые отели претерпели сильные изменения по сравнению с аналогичными отелями, открывавшимися пять лет назад. Формат мини-отеля изменился, превратившись в уменьшенную копию крупной гостиницы. Гость стал более требователен и желает получать не только комфортное размещение, но и ряд дополнительных услуг, таких как экскурсионное…

Реферат

Подробнее...

Классификация компьютерных вирусов

Однако многие вирусы используют алгоритмы шифрования своего кода. Сложность обнаружения таких вирусов заключается в том, что при каждом новом заражении они изменяют свои коды. Но, так как процедура шифрования вируса все же известна, то его код все равно можно вычислить. Поэтому вслед за шифрующимися вирусами появились вирусы-мутанты или полиморфные вирусы. Механизм распространения макрокомандных…

Реферат

Подробнее...

Использование LDAP — резюме

Прежде чем попытаться ответить на этот вопрос, давайте абстрагируемся от тактических соображений производительности. В целом, реляционные СУБД всё ещё значительно быстрее реализаций LDAP. По мере разработки служб каталогов второго поколения — это положение меняется, и, хотя реляционные СУБД всегда будут оставаться быстрее LDAP, разрыв значительно сократился вплоть до точки, в которой различия…

Реферат

Подробнее...

Этапы автоматизации деятельности предприятия

Проектирование продукции и технологических процессов. Информация о составе продукции, технологических маршрутах ее изготовления, разработка продукции в соответствии с требованиями клиентов, а также оценка затрат, которые понесет предприятие при выпуске такой продукции. Планирование производственной деятельности. Составление производственных планов различного уровня, — от стратегических…

Реферат

Подробнее...

Stepic REST API

Api/courses/{pk} — по ключу pk (номер курса) сервер возвращает информацию о курсе: номер, название, формат курса, целевая аудитория, наличие сертификата, номер автора в системе, требования к студенту, описание курса, номера входящих модулей, дедлайны, количество уроков и множество другой информации. Платформа Stepic задумана как «инструмент для распространения знаний», и в связи с этим…

Реферат

Подробнее...