9785006042513
ISBN :Возрастное ограничение : 12
Дата обновления : 19.08.2023
Тексты, которые используются в академической сфере – специфичны тем, что базовое знание, определения, распространённые подходы, методы, порядок изложения и т. д. многократно используются в разных работах, разными ВУЗами, на протяжении десятилетий. С введением в практику ВУЗов антиплагиата все студенческие тексты смело можно отнести к высокочастотным, их сотни и тысячи раз перефразировали, пытаясь добиться уникальности и каждый текст, сходной тематики должен быть перефразирован вновь так, чтобы он не напоминал предыдущие, а проверка будет осуществляться по таким крошечным частям текста, как шинглы.
Согласно обобщенных данных, АО «Антиплагиат» занимает ок. 80% отечественного рынка проверок работ на наличие заимствований, что характеризуется цифрой – 16 млн. проверок, стоимость одной проверки 472 руб. Любой маркетолог восхититься маркетингом этой компании, бросающей взгляды на зарубежье (возможна проверка на 100 языках).
Вероятно показатель количества проверок, по итогам 2023 г. прирастет, т. к. Антиплагиат учится выявлять генеративные тексты, написанные с помощью (ИИ, AI): GPT, GPT-3, GPT-3,5, GPT-4, ChatGPT (все версии), monica, jasper, neuraltext, writesonic, sber, NeuralWriter, neuro-texter, YandexGPT и др., и если генеративный текст найден, выдается уведомление – «Внимание, документ подозрительный: в документе присутствует сгенерированный текст».
В марте 2022 г. АО «Антиплагиат» увеличил стоимость проверок с 270 руб. до 472 руб., в этой связи справедливо задаться рядом вопросов, как студентам и ВУЗам РФ сэкономить на проверках, обеспечивая высокое качество студенческих работ.
Сущность глубокого перефразирования, как легального и рекомендованного метода повышения уникальности текстов
Глубокое перефразирование, это изложение текста источника «своими» или «другими словами», без потери смыслового содержания. В процессе перефразирования автор добивается отличия нового текста от текста источника. Академический рерайт, или академическое перефразирование – изложение текстов, научного содержания, своими словами.
Пример GPT-промпта 1
Перефразируй текст, используй научный стиль изложения, сохрани абсолютно все факты, имена собственные, законы и логику изложения [ваш текст]
Согласно промпта 1 мы перефразировали текст в GPT и сверили его на отличия по методу шинглов, состоящих из двух слов (Ш2), тексты отличаются на 58%, рис. 7, следовательно, такой текст проверку в Антиплагиат не пройдет, т.к. пороговое значение отличия по показателю Ш2 – более 80%.
С целью объективности, повысим уникальность исходного текста с помощью КонтрПлагиат, рис. 8.
Рисунок 7 – Сверка текста источника (правое окно) с текстом, перефразированным GPT (левое окно) по методу шинглов, состоящих из 2 слов, желтым выделен текст, который не изменился – отличие 58%
Рисунок 8 – Сверка текста источника (правое окно) с текстом, перефразированным КонтрПлагиат (левое окно) по методу шинглов, состоящих из 2 слов – отличие 88%
Как рассчитать объем дефицита уникального текста
Имеется текст, объемом 100 тыс. знаков, текущая уникальность 20%, требуется 70%. Сколько текста нужно изменить по методу шинглов, чтобы достичь нужного показателя оригинальности.
Расчет количества знаков в 1% текста:
100 тыс. знаков / 100% = 1 тыс. знаков содержится в 1% текста
Расчет дефицита уникальности:
Требуемая оригинальность – оригинальность имеется = дефицит оригинальности
Расчет объема знаков для покрытия дефицита оригинальности текста:
Дефицит оригинальности * количество знаков в 1% текста
Обоснование метода подготовки текстов для проверки в Антиплагиат ВУЗ
Библиотеки, из источника знаний, превратились в источники плагиата. Проблему усугубляет ограниченность формулировок знаний, как правило все учебные программы унифицированы (однообразны) и опираются на официальный перечень учебной литературы. В этой связи, любой текст, опирающийся на источники, имеет низкий показатель уникальности, т.к. текст пишется с использованием метода научной компиляции, используются общеизвестные знания и распространённые формулировки.
В этой связи проверять свеженаписанный (скомпилированный) текст в Антиплагиат ВУЗ не имеет смысла, т.к. чуда не случится, и он покажет недостаточную уникальность.
Вновь созданный текст (первичный) необходимо подвергнуть глубокому перефразированию. Проверку в Антиплагиат ВУЗ следует выполнять после получения показателя отличия вторичного текста от первичного по показателю Ш2 на 80% и более процентов.
Данный подход может привести к двум возможным результатам:
– требуемая уникальность достигнута;
– необходимая уникальность не достигнута.
В случае недостижения уникальности, руководствуясь отчетом о полной проверке, необходимо места плагиата подвергнуть вторичному глубокому перефразированию, с показателем Ш2 – 90—95%.
После вторичной глубокой переработки, текст может быть проверен в системе поиска заимствований, как правило второй проверки достаточно, для получения необходимого уровня уникальности.
Почему не получается, после первой проверки, перефразировать места плагиата и достигнуть нужный процент. Да, такая проблема существует, вторая проверка покажет, что текст, который в перовой проверке не был плагиатом, местами отмечен таковым и процент не набран. Антиплагиат оценивает текст в совокупности, к сожалению схитрить не получится, текст необходимо перефразировать полностью, так, чтобы при сверкам по шинглам, состоящим из 2 слов он отличался от источника более чем на 80%.
Инструментальная среда глубокого перефразирования
Мы не касаемся практики реализации процесса глубокого перефразирования, смысл которого заключается в изложении текста «своими словами». Технически мы преследуем цель изменения шинглов, состоящих из 2 слов, на 80 и более процентов.
Измерить данный показатель возможно используя бесплатный продукт AntiPlagiarism.NET, доступный для скачивания на сайте: etxt.
Работать в программе достаточно просто, в левое окно помещается текст рерайта (подвергнут глубокому перефразированию), в правое окно помещается первичный текст (источник, текст до рерайта). За считанные секунды программа выдает процентное значение показателя отличия текста, по методу Ш2 или с учетом определения рерайта (параметр расположен в нижнем, правом углу интерфейса программы).
Если тексты отличны по показателю Ш2 на 80 и более процентов, это является основанием для проверки текста в Антиплагиат ВУЗ, если данный показатель не получен, то повода отдавать текст на платную проверку – нет.
Применение метода в практике ВУЗов
Бесплатное программное обеспечение AntiPlagiarism.NET позволяет сверять тексты на отличие – локально.
По нашему мнению, вновь написанная работа должна пройти перефразирование и локальную проверку, с учетом показателя Ш2, с применением программного обеспечения AntiPlagiarism.NET. Если показатель отличия текста Ш2 до рерайта и после рерайта находится на уровне больше 80%, то данная работа может быть отправлена на проверку в Антиплагиат ВУЗ.
Если показатель уникальности, при локальной сверке текстов, находится на существенно более низком уровне, то проверять работу в антиплагиат не имеет смысла, данная работа должна быть подвергнута дополнительному перефразированию, автору необходимо добиться рекомендованных показателей отличия текстов. В случае получения заданного показателя отличия текстов, работа может быть направлена на проверку в Антиплагиат ВУЗ, для получения справки.
Данный подход примечателен тем, что для успешного прохождения потребуется одна проверка, если текст высокочастотен, то две. Экономический эффект для автора – ощутимый, для ВУЗа – более чем ощутимый, т.к. не только снижает трудозатраты специалистов, экспертов проверки, но и экономит немалые денежные средства, которые могут быть направлены на развитие ВУЗа и улучшение качества учебного процесса в высшей школе.
2. ВВЕДЕНИЕ В ПРАКТИКУ ИСПОЛЬЗОВАНИЯ ГЕНЕРАТИВНЫХ ВОЗМОЖНОСТЕЙ GPT
2.1. Возможности генеративного предварительно обученного трансформера – GPT
GPT – это новация начала 2023 г., следовательно ее сопровождают все маркеры, сопутствующие развитию инновации. Про GPT написано немало, по заявлениям разработчиков известно, что GPT-4 – самая передовая система OpenAI, которая обеспечивает более безопасные и полезные ответы. Не за горами выход GPT-5, которая станет еще удобней и полезней.
Опыт GPT не оставил равнодушным целый ряд отечественных, известных компаний, известно о попытках «Сбера» реализовать «Рерайтер», «Суммаризатор», в середине лета запущена Yandex GPT, разработчики называют свое творение российским конкурентом языковой модели GPT-4 от «Яндекса». Разработчики Yandex GPT заявили, что она умеет общаться, писать тексты и генерировать идеи почти как человек. К сожалению, мы не смогли посотрудничать с Yandex GPT, т.к. то, что заявляют разработчики и то, что имеется на практике, как говорят одесситы – это две большие разницы.
GPT обучалась на массивах текстовых данных, другими словами на публикациях, которые присутствуют в Интернет. В массив вошли публикации открытых источников, форумов, статьи сайтов, сетевые библиотеки, книги, исследования, опубликованные до 2021 г. Поэтому, ответы GPT не являются научными и не являются актуальными.
Сами ответы – не есть результат когнитивности, они представляют собой компиляцию знаний, опубликованных в Интернет, во избежание претензий авторов интернет-материалов, GPT старается излагать тексты «другими словами».
Многочисленные статьи на тему GPT лукавят, когда говорят о способностях творения OpenAI. Большинство тестов, по решению задач, не описанных в практике людей GPT проваливает. Не смотря на это популярность GPT, взлетев с начала года, испытала 10% снижение интереса к середине 2023 г., оживить публичный интерес не смогла четвертая и плюсовая версия ИИ, появились сообщения о некотором «отупении» GPT, все это наталкивает на мысль, что глубокое проникновение ИИ и конкуренция, вынудят разработчиков GPT сделать доступ к младшим версиям бесплатным.
Исходя из реальности, дальнейшее отношение и технология работы с GPT будут строиться на основании реальности, а не маркетинговых заявлений.
2.2. Алгоритм составления GPT-запроса (промпт, инструкция)
Алгоритма идеального запроса не существует, т. к. GPT развивается и все, что хорошо работало сегодня, может плохо работать завтра.
Несмотря на это можно рассмотреть следующий подход:
Определение роли ChatGPT, «Я хочу, чтобы вы выступили в роли высококвалифицированного специалиста-эксперта». КонтрПлагиат неоднократно показывал на примерах, что роль не играет значение, ответ не зависит от того, кем себя должна представить GPT, профильным экспертом или пастухом, промпт 2, рис. 9.
Пример GPT-промпта 2 – Роль, в GPT-запросе не имеет значения
Я хочу, чтобы вы выступили в роли пастуха, с образованием 4 класса, изложи теорию шкалирования Лайкерта, указав на аспекты ее практического применения
Рисунок 9 – Роль, указанная в запросе к GPT, не играет значения
Четко сформулируйте задачу и порядок ее выполнения. Этот подход имеет право на жизнь.
Обеспечьте контекст. Чем больше контекста вы предоставите, тем более релевантным и полезным будет ответ. Другими словами, мы должны дать GPT информацию для размышления, в противном случае ИИ начнет компилировать ответ на базе массивов, на которых учился. На рис. 10 приведен пример промпта и ответа GPT.
Пример GPT-промпта 3 – Запрос с контекстом
Какие правовые акты, с какого числа, легализуют цифровой рубль в России, какие возможности открываются перед гражданами и бизнесом [контент]
Рисунок 10 – Пример контекстного запроса в GPT
Все книги на сайте предоставены для ознакомления и защищены авторским правом