Регистрация / Вход
Прислать материал

Выполнение сравнительного статистического аналиаз грамматических и лексических характеристик текстов различных жанров и авторов для целей их различения, идентификации и классификации сиспользованием программного анализатора текстов.

Стадии проекта
Предложение принято
Конкурс завершен
Выполнение этапа проекта

Проведения стажировок в российских научно-образовательных центрах

Этапы проекта

1
05.09.2005 - 05.12.2005
Цель исследования – оценка эффективности различения, идентификации и классификации текстов по известным количественным грамматическим и лексическим характеристикам на материале текстов различных жанров и авторов, выявление новых информативных характеристик, выявление путей работы с грамматическими характеристиками текстов, наработка методик по количественному анализу текстов.
лаборатории) на основе методов, реализованных в программном анализаторе текстов. При необходимости модификация и дополнение имеющихся методов в программе.
В итоге проведения НИР получены следующие результаты:
1. Получены и зафиксированы в отчете сведения о программах и форматах текстовых материалов, разработанных и накопленных в лаборатории общей и компьютерной лексикологии и лексикографии.
2. На основе полученных сведений существенно доработан программный анализатор текстов «Стилеанализатор»: добавлена работа с вертикальным (грамматически размеченным) текстом, функции предварительной обработки текстовых данных, расширен язык задания частотных характеристик, добавлена функция привязки данных к фрагментам текстов.
3. Подготовлены текстовые материалы для анализа газетных текстов по жанровым типам и источникам, материалы художественных произведений.
4. Проведены масштабные эксперименты по оценке классификации текстов по жанровым типам и источникам публикации 14 различных наборов характеристик на основе 3-х методов классификации и 3-х модификаций одного метода. Запланированные по проекту исследования выполнены, поставленные задачи решены в полном объеме.
Развернуть

Программа

Программа "Исследования и разработки по приоритетным направлениям развития науки и техники" на 2002-2006 годы

Программное мероприятие

1.11 Развитие системы стажировок молодых ученых и преподавателей в крупных научно-образовательных центрах (включая зарубежные) и участие в конференциях, симпозиумах, семинарах, школах (в том числе за рубежом)
Тема
Разработка макетов аппаратно-программных комплексов для лабораторной и функциональной диагностики.
Продолжительность работ
2011, 5 мес.
Бюджетные средства
30 млн
Количество заявок
53
Тема
Разработка прикладного программного обеспечения для автоматизации заполнения свойств (описаний) научно-технических документов на основе анализа полного их текста.
Продолжительность работ
2009, 5 мес.
Бюджетные средства
2,5 млн
Количество заявок
8
Тема
Разработка методов лабораторной и функциональной диагностики для создания на их основе макетов аппаратно-программных комплексов.
Продолжительность работ
2011 - 2012, 21 мес.
Бюджетные средства
60 млн
Количество заявок
45
Тема
Поставка комплектов оборудования в научно-образовательные центры национальной нанотехнологической сети для создания информационно-аналитической инфраструктуры
Продолжительность работ
2009, 6 мес.
Бюджетные средства
72,27 млн
Количество заявок
2
Тема
Разработка методов и программных средств автоматического мониторинга терминологических систем предметных областей на основе построения и анализа моноязычных, параллельных и сравнимых корпусов.
Продолжительность работ
2014 - 2016, 27 мес.
Бюджетные средства
55 млн
Количество заявок
0