Система «CQPweb» является веб-системой, которая позволяет лингвистам проводить исследования поведения языка на больших текстовых корпусах и создавать запросы, чтобы извлекать информацию из этих текстовых корпусов.
Данный ресурс является бесплатным, но он не позволяет пользователям загружать собственные текстовые корпуса, чтобы извлекать из них данные. Пользователю доступно только 45 готовых текстовых корпуса, среди них можно выделить корпуса на английском, немецком, русском, арабском, итальянском, испанском языках. Пользователь может создавать запросы к этим корпусам с помощью специального языка запросов, описание которого доступно на сайте. Система позволяет сохранять полученный результат на компьютер пользователя в формате «txt». Приложение разграничивает функциональные возможности по ролям, некоторая часть корпусов текстов является закрытой для использования. Система не имеет программного доступа и не может сохранять динамически добавляемые атрибуты.
Вывод: данная система подходит для исследования уже готовых текстовых корпусов, но не подходит для исследования новых текстовых корпусов, т.к. не предоставляет такую возможность.
Итоги сравнения
Итоги сравнения хранилищ приложений и систем представлены в таблице 1.1.
Таблица 1.1. Приложения/системы для хранения корпусов текстов.
|
Характеристика. | Приложение «AntConc». | Приложение «WordSmith Tools». | Система «Sketch Engine». | Система «CQPweb». |
Предъявляют ограничение по памяти для хранения корпусов текстов. | Нет, определяется оперативной памятью компьютера. | Нет, определяется оперативной памятью компьютера. | Да, 1 000 000 слов примерно 50 Мбайт. | Нет, т.к. не существует возможности создавать собственное хранилище. |
Поддерживают различные типы форматов. | Нет, только txt, html, htm, xml и ant. | Нет, только txt. | Нет, только doc, docx, htm, thml, pdf, ps, tar. bz2, tar. gz, tgz, tmx, txt, vert, xml, zip. | Нет, т.к. не существует возможности создавать собственное хранилище. |
Предоставляют возможность сохранение полученных результатов. | Да, пользователь может сохранить результаты в формате txt. | Да, пользователь может сохранить результаты в формате txt, xml. | Нет, не существует возможности, чтобы сохранить полученные результаты на компьютер пользователя. | Да, система позволяет сохранять полученный результат на компьютер пользователя в формате txt. |
Имеют встроенные корпуса текстов. | Нет. | Нет. | Да, Система хранит 292 готовых текстовых корпусов. | Да, Система хранит 45 текстовых корпусов. |
Являются общедоступными. | Да. | Нет. | Частично, система ограничивает доступ к некоторым текстовым корпусам. | Частично, система ограничивает доступ к некоторым текстовым корпусам. |
Разграничивают функциональные возможности по ролям. | Нет, данная возможность не предусмотрена приложением. | Нет, данная возможность не предусмотрена приложением. | Да, пользователю доступен ограниченный набор функцией, размер хранилища и доступ к другим текстовым корпусам. | Да, пользователь имеет ограниченный доступ к другим текстовым корпусам. |
Имею интерфейсы прикладного уровня. | Нет. | Нет. | Нет. | Нет. |
Позволяют сохранять динамические атрибуты. | Нет. | Нет. | Нет. | Нет. |
В процессе анализа существующих хранилищ выявлено, что рассматриваемые хранилища существующих приложений и систем не являются адаптивными, гетерогенными и не имеют интерфейсов прикладного уровня.