Регистрация / Вход
Прислать материал

Реализация локального антиплагиата с помощью объектного приложения языка C++

Сведения об участнике
ФИО
Ленкин Алексей Викторович
Вуз
Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Приамурский государственный университет имени Шолом-Алейхема»
Тезисы (информация о проекте)
Область наук
Информационные технологии и вычислительные системы
Раздел области наук
Информационные технологии
Тема
Реализация локального антиплагиата с помощью объектного приложения языка C++
Резюме
В данной статье рассмотрена проблема присвоения текстовой информации, пути ее решения с помощью программных средств. Описана программная реализация локального антиплагиата с помощью объектной среды языка программирования С++.
Ключевые слова
антиплагиат, язык программирования C++, информация, уникальность
Цели и задачи
В целях предотвращения информационного были созданы специальные программы для поиска информационного плагиата, которые, используя собственную базу источников, проверяют, сколько в проверяемых материалах заимствованных данных и выводят результат, опираясь на который можно делать вывод об уникальности. Разрабатываемая программа позволяется обнаруживать плагиат в документах на основе существующей базы текстов, загружаемых пользователем.
Введение

Для предотвращения воровства информации были созданы специальные программы для поиска информационного плагиата, которые, используя собственную базу источников, проверяют, сколько в проверяемых материалах заимствованных данных и выводят результат, опираясь на который можно делать вывод об уникальности.

Целью исследования является создание такой программы обнаружения плагиата, которая не только будет не уступать по качеству уже имеющимся продуктам данного типа, но и во многом их превзойдёт.

Методы и материалы

Данное приложение разработано с помощью среды программирования Visual Studio 2008. Оно имеет минималистичный дизайн, лишенный ненужных опций и предназначено для проверки документов формата doc. Интерфейс программы очень прост: 4 пункта меню, 3 поля вывода и одна кнопка. После добавления необходимых файлов на проверку, а также заполнения базы эталонных файлов, они соответственно отобразятся в соответствующих полях вывода. Перед началом работы с программой необходимо удалить все пробелы из названий проверяемых и эталонных файлов.

Описание и обсуждение результатов

Программа использует простой алгоритм проверки и состоит из нескольких функций, но основными являются:

  1. Zerofikator – производит форматирование входного файла, удаляя из него ненужные для проверки знаки препинания и цифры, а также переводит все буквы в нижний регистр.
  2. Plagiater – анализирует два входных файла на процент плагиата, процесс следующий: считывается слово из проверяемого файла и производится поиск его в эталонном файле, если слово найдено, прибавляет счётчик к количеству повторившихся слов и повторяет это, сравнивая следующие, пока не найдутся различные, тогда, если набранное количество слов больше 3 – отнимает это количество повторов из счётчика и дальше ищет другие повторы. В результате работы программы, процент плагиата вычисляется по следующей формуле («количество повторившихся слов» / «общее число слов в документе»)*100 %.
  3. Программа использует готовый парсер “Antiword” для перевода документов формата doc в понятный программе формат txt.

В результате исследования можно описать преимущества и недостатки разработанного программного продукта.

Преимущества программы:

  1. Не требуется подключение к сети Интернет для работоспособности.
  2. Быстрота проверки текста (основное время занимает не поиск плагиата, а стандартизация текста для проверки).
  3. Возможность сохранения результата в документ формата doc.
  4. Проверка популярного формата электронных документов doc.
  5. Минималистический дизайн.

Недостатки программы:

  1. Долгое время стандартизации текста.
  2. Возможны ложные срабатывания на частые фразы из 5 и более слов (к примеру, «В данной статье рассмотрена проблема...»).
  3. Нет проверки изображений и формул, они попросту игнорируются при проверке.
  4. Необходимость отсутствия в пути размещения программы и имени файлов пробелов.
Используемые источники
1. Plagium vulgaris: как предотвратить плагиат в науке [Электронный ресур]. URL: http://ria.ru/online/20110131/328762171.html (дата обращения 01.03.2015).
2. Плагиат и Антиплагиат [Электронный ресурс]. URL: http://www.russ.ru/pole/Plagiat-i-Antiplagiat (дата обращения 01.03.2015).
3. Против рейдерства в науке [Электронный ресурс]. URL: http://www.chaskor.ru/article/protiv_rejderstva_v_nauke_32043 (дата обращения 01.03.2015).
4. Система Антиплагиат [Электронный ресурс]. URL: http://www.antiplagiat.ru/ (дата обращения 01.03.2015).
5. Шаратов Р.В., Шаратова Е.В. Система проверки текстов на заимствования из других источников // Электронные библиотеки: перспективные методы и технологии, электронные коллекции – RCDL’2011: тр. 13-й Всерос. науч. конф. Воронеж, 2011. С. 121-126.
Information about the project
Surname Name
Lenkin Aleksei Viktorovich
Project title
The implementation of local Anti-plagiarism using C++ object language application
Summary of the project
The problem of assigning textual information is considered, ways to solve the problem with the help of software is described. The implementation of the local Anti-plagiarism software using object-oriented programming language C ++ is described.
Keywords
anti-plagiarism, the programming language C ++, information unique