Регистрация / Вход
Прислать материал

Алгоритмическое и программное обеспечение сервиса для комплексного SEO-анализа сайта

Фамилия
Рябыкин
Имя
Илья
Отчество
Алексаандрович
Номинация
Информационные технологии
Институт
Институт информационных технологий и автоматизированных систем управления (ИТАСУ)
Кафедра
Автоматизированных систем управления
Академическая группа
МИТ-13-2
Научный руководитель
доц., к.т.н. Пономарева Ю.П.
Название тезиса
Алгоритмическое и программное обеспечение сервиса для комплексного SEO-анализа сайта
Тезис

С каждым годом в российском сегменте интернета количество ресурсов растёт. На конец 2016 года насчитывается 15 миллионов сайтов. Для того, чтобы занимать высокие позиции, сайту требуется продвижение. Одним из этапов продвижения является SEO (Search Engine Optimization, рус. Оптимизация под поисковые системы). SEO включает в себя набор этапов, при выполнении которых достигается максимальный успех в продвижении сайта. 

Сайт E-Kawasaki.ru является интернет-магазином официального дистрибьютора Kawasaki в России. Анализ сайта показал, что ресурс плохо индексируется в поисковой системе Яндекс. Из 190 000 страниц проиндексировано всего лишь 5 000. При этом в поисковой системе Google проиндексировано 170 000 страниц. Для выяснения причин расхождения в индексировании возникает необходимость аудита сайта, что является одним из этапов SEO.

«Аудит сайта» является одним из наиболее затратных по времени этапом, он включает в себя задачи исследования поисковой выдачи и её сравнение. Для сайтов с большим количеством страниц сложно выполнить анализ поисковой выдачи вручную. Возникает необходимость создания ПО для автоматизации процесса аудита, включающего следующие возможности: определение непроиндексированных страниц, сравнение выдачи в поисковых системах, определение типа страницы (главная, разводящая, карточка товара).

    В настоящий момент разработано более 300 инструментов для решения задач аудита. В ходе анализа этих сервисов было выяснено:
•    Инструменты, решающие поставленную задачу являются платными и для небольших компаний покупка неоправдана финансово. 
•    Бесплатные инструменты не предоставляют такой возможности.

    В предлагаемом ПО определение типа страницы это ключевая функция, которая поможет идентифицировать проблемные места сайта. Сложность её реализации заключается в том, чтобы создать универсальный шаблон, по которому будет определяться тип, в независимости от исследуемого сайта. Чтобы реализовать функции, собирающие информацию из выдачи поисковых систем, в ПО нужно интегрировать веб-сервисы: Google AdWords API, Яндекс XML. Google API разрешает выполнять не более 10000 операций в день, что требует использования прокси и сервисов для обхода «капчи». На рис. 1 изображена архитектура предлагаемого решения.

Рис. 1. Архитектура программного обеспечения