Регистрация / Вход
Прислать материал

Разработка и реализация алгоритмических и программных средств тематической категоризации Интернет-ресурсов с использованием семантического анализа текстового содержимого web-страниц.

Стадии проекта
Предложение принято
Конкурс завершен
Выполнение этапа проекта
Проект
02.447.11.1008
Организация
ООО "МегаВерсия"

разработка и реализация алгоритмических и программных средств тематической категоризации (далее СТК) Интернет ресурсов с использованием семантического анализа текстового содержимого web-страниц для использования в системах контентной фильтрации

Соисполнители

Этапы проекта

1
01.08.2005 - 31.10.2005
2
01.11.2005 - 08.12.2005
Проведена разработка СТК (1-я очередь) и рабочей документации на нее, проведение автономных испытаний 1-й очереди СТК (АИ-1):
Развернуть
3
01.01.2006 - 31.03.2006
Краткое описание выполненных работ: Разработка СТК (2-я очередь) и рабочей документации на нее, проведение автономных испытаний 2-й очереди СТК (АИ-2):

Разработка ПС «Ведение информационных ресурсов», в том числе:
- задача «Поиск сайтов и страниц».
Разработка ПС «Обход сайтов», в том числе:
- задача «Планирование процессов обхода»;
- задача «Обход сайта».
Разработка ПС «Поиск новых сайтов», в том числе:
- задача «Анализ и утилизация адресов»;
- задача «Прием из локальных СКФ».
Разработка ПС «Каталогизации сайтов», в том числе:
- задача «Загрузка и регистрация в БД»;
- задача «Очистка страницы»;
- задача «Анализ контента страницы»;
- задача «Классификация сайта».
Разработка ПС «Контроль и настройка процедуры классификации», в том числе:
- задача «Мониторинг новых поступлений в классификаторы»;
- задача «Настройка лексического состава профиля категории»;
- задача «Проверка результатов классификации сайта»;
- задача «Настройка порога отнесения страницы к категории».
Разработка рабочей документации.
Разработка программы и методики АИ-2.
Проведение АИ-2.

Перечень документов, разработанных на этапе:
Рабочая документация на программные компоненты 2-й очереди СТК в составе:
- спецификация (ГОСТ 19.202-78);
- описание программы (ГОСТ 19.402-78);
- руководство системного программиста (ГОСТ 19.503-79);
- руководство оператора (ГОСТ 19.505-79).
Программа и методики АИ-2.
Протоколы по пунктам программы АИ-2.
Акт по результатам АИ-2.
Технический акт.
Акт сдачи- приемки.
Документация, подтверждающая достижение программных индикаторов.
Развернуть
4
01.04.2006 - 30.06.2006
Разработка СТК (3-я очередь) и рабочей документации на нее, проведение автономных испытаний 3-й очереди СТК (АИ-3):
Разработка ПС «Поиск новых сайтов», в том числе:
- задача «Обход сайтов (каталогов интернет)»;
- задача «Выделение адресов по протоколу IMAP/POP3»;
- задача «Выделение адресов по протоколу NNTP»;
- задача «Прием адресов от пользователей».
Разработка ПС «Отчеты и статистика», в том числе:
- задача «Отчет о наполнении категорий»;
- задача «Общее качество классификации»;
- задача «Динамика поступления информации».
Разработка ПС «Ведение пользователей и управление правами доступа», в том числе:
- задача «Ведение пользователей и управление правами доступа»;
- задача «Ведение информации об СКФ».
Разработка рабочей документации.
Разработка программы и методики АИ-3.
Проведение АИ-3.
Перечень документов, разработанных на этапе:
Рабочая документация на программные компоненты 3-й очереди СТК в составе:
- спецификация (ГОСТ 19.202-78);
- описание программы (ГОСТ 19.402-78);
- руководство системного программиста (ГОСТ 19.503-79);
- руководство оператора (ГОСТ 19.505-79).
Программа и методики АИ-3.
Протоколы по пунктам программы АИ-3.
Акт по результатам АИ-3.
Технический акт.
Акт сдачи- приемки.
Документация, подтверждающая достижение программных индикаторов.
Развернуть
5
01.07.2006 - 31.10.2006
АННОТАЦИЯ
по работам пятого этапа Государственного контракта
от «01» августа 2005 г. № 02.447.11.1008
и дополнительного соглашения от «9» марта 2006 г. №1
по теме
"ИТ-22.2/002. Разработка и реализация алгоритмических и программных средств тематической категоризации Интернет-ресурсов с использованием семантического анализа
текстового содержимого web-страниц".

Согласно календарному плану на пятом этапе проводились следующие работы:

1) Разработка рабочей и эксплуатационной документации на СТК в целом (по ГОСТ 34.201-89):
- ведомость эксплуатационных документов (ЭД);
- руководство пользователя (И3);
- массив входных данных (В6);
- состав выходных данных (сообщений) (В8);
- описание технологического процесса обработки данных (включая телеобработку) (ПГ);
- общее описание системы (ПД);
- руководство по внедрению;
- формуляр (ФО);
- программа и методики предварительных испытаний (ПМ);
- программа и методики приемочных испытаний (ПМ).
2) Изготовление оригинала СТК.
3) Разработка программы и методики предварительных испытаний.
4) Проведение предварительных испытаний.
Результаты проведения предварительных испытаний:
- протоколы по пунктам программы предварительных испытаний;
- акт по результатам предварительных испытаний.
5) Проведение опытной эксплуатации СТК в целом.
6) Корректировка программной и эксплуатационной документации по результатам предварительных испытаний и опытной эксплуатации.
Результат проведения приёмочных испытаний:
- акт по результатам корректировки технической документации.
7) Проведение приёмочных испытаний.
Результаты проведения приёмочных испытаний:
- протоколы по пунктам программы приёмочных испытаний;
- акт по результатам приёмочных испытаний.
8) Корректировка программной и эксплуатационной документации по результатам приемочных испытаний.

На различных этапах ввода СТК в действие также были разработаны:
- акт о готовности к предварительным испытаниям, утвержденный руководителем предприятия;
- акт о готовности к приемочным испытаниям, утвержденный руководителем предприятия;
- журнал замечаний опытной эксплуатации;
- рабочий журнал опытной эксплуатации;
- акт о присвоении КД и ТД литеры «О»;
- документация, подтверждающая достижение программных индикаторов;
- технический акт;
- акт сдачи-приемки.


Все работы по этапу проведены. Документация представлена.
Развернуть

Программа

Программа "Исследования и разработки по приоритетным направлениям развития науки и техники" на 2002-2006 годы

Программное мероприятие

2.2 Проведение опытно-конструкторских, технологических и экспериментальных разработок по приоритетным направлениям развития научно-технической сферы (в том числе на долевой основе с хозяйствующими субъектами)
Тема
Разработка и реализация алгоритмических и программных средств тематической категоризации Интернет-ресурсов с использованием семантического анализа текстового содержимого web-страниц
Продолжительность работ
2005 - 2006, 23 мес.
Бюджетные средства
10 млн
Количество заявок
6
Тема
Разработка программных средств смыслового поиска и анализа материалов научных исследований в области наук о жизни, опубликованных на естественных языках в научной печати и в Интернете.
Продолжительность работ
2005 - 2006, 23 мес.
Бюджетные средства
10 млн
Количество заявок
4
Тема
Создание программного комплекса информационно-аналитической поддержки научно-технической деятельности на основе вычислительного семантического поиска и анализа неструктурированной текстовой информации.
Продолжительность работ
2011 - 2013, 28 мес.
Бюджетные средства
120 млн
Количество заявок
16
Тема
Создание экспериментального программно-методического комплекса для естественно-математической дистанционной школы, интернет-олимпиады и интернет-конференции с персонифицированной обратной связью.
Продолжительность работ
2005 - 2006, 23 мес.
Бюджетные средства
5 млн
Количество заявок
2
Тема
Разработка комплекса программных средств фильтрации мультимедийных данных, поступающих из сети Интернет, на основе анализа аудио и видео составляющих.
Продолжительность работ
2012 - 2013, 17 мес.
Бюджетные средства
32 млн
Количество заявок
7