Интеллектуальный анализ текстовых документов и баз данных: проекты, экспертиза, исследования, консультации, публикации. Надеюсь, что мои достижения привлекут внимание и дадут повод для совместной работы.
Вы здесь ▸
Технологии и инструменты ▸ Как самостоятельно выбрать лучший текст? Например, учебник или роман.
Интеллектуальный анализ текстовых документов и баз данных: проекты, экспертиза, исследования, консультации, публикации. Надеюсь, что мои достижения привлекут внимание и дадут повод для совместной работы.
Как самостоятельно выбрать лучший текст? Например, учебник или роман.
Ранее мною было показано, что можно обоснованно и самостоятельно выбрать лучший текст из нескольких имеющихся, не используя запредельных технологий. Например, выбрать учебник для рекомендаций студентам или для самоподготовки. Ну, или роман для прочтения, похожий на недавно прочитанный и понравившийся текст. А здесь я покажу, как можно выполнить эту приятную работу без программирования с помощью приложения Текстоматика. При этом не надо писать программы на Python по приведенным рекомендациям.
Еще раз подчеркну, что задача выбора подходящего текстового материала достаточно типична. Под термином “подходящий” в данном случае я имею в виду материал, похожий по содержанию на некоторый эталон. Например, описание какого-либо интересного занятия, тематический план для самообразования, рабочая программа по учебной дисциплине, понравившаяся книга и т.п. Понятно, что сделанный выбор будет предварительным, более точное мнение о выбранном тексте можно сформулировать, начав его читать. 😉
В настоящей статье я рассказываю как можно самостоятельно выбрать учебник по базам данных. Порядок действий приведен ниже.
Выбор учебников для сравнения с эталоном
Учебники — это файлы в форматах docx, pdf или txt. А эталон в нашем случае это рабочая программа дисциплины “Базы данных”. Например, может подойти эта.
Загрузка документов
Итак, загрузка документов. Ее можно выполнить после запуска приложения Текстоматика и авторизации в нем. Используйте блок “Загружайте документы” на начальной странице или меню “Документы/Загрузить”. На форме загрузки категорию для загружаемых документов (например, “Базы данных”) и при необходимости теги (например, “Учебник”). Потом согласно инструкции нажмите кнопку “Выбрать файлы”, выберите файлы, сделайте описание документов и нажмите кнопку “Загрузить”.
Одновременно можно выбрать и загрузить несколько файлов. Для дополнительной информации используйте справку — значок рядом с полем формы. Загрузка небыстрый процесс, файлы подвергаются серьезному анализу. Поэтому наберитесь терпения.
Видео загрузки документов
Выбор модели оценки
Использование модели оценки документов обязательно для того, самостоятельно выбрать лучший текст. Для выбора модели используйте блок “Выбирайте модель оценки” на начальной странице или меню “Документы/Выбрать модель”. Если Вы уже создали модель ранее, то отметьте ее в списке и нажмите кнопку “Выбрать”. А если модели нет, то ее нужно создать — нажмите кнопку “Создать”.
На форме создания модели ее можно создать самостоятельно, но лучше использовать стандартную. Нажмите кнопку “Предопределенную модели” и выберите модель “ПОМ_Сходство_документов”. Введите имя модели и исправьте ее описание (если необходимо). Модель включает единственный индикатор оценки для оценки документов – “Семантическое сходство”. Параметры модели можно оставить те, что заданы по умолчанию (их можно изменить позже). Нажмите кнопку “Сохранить”. Вы увидите, что модель появилась в списке и она уже отмечена. Нажмите кнопку “Выбрать”.
Видео выбора модели оценки документов
Настройка модели и оценка документа
После выбора модели для оценки Вы переходите к списку документов. Другие способы выйти на этот список — использовать блок “Оценивайте документы” на начальной странице или меню “Документы/Показать все”. Важный момент — мы будем оценивать эталон. Индикатор “Семантическое сходство” позволяет оценить семантическое или смысловое сходство, похожесть, близость текста эталона с текстами других документов данной категории — “Базы данных” в нашем случае. Поэтому отмечаем документ “Рабочая программа дисциплины…”, нажимаем на кнопку “Далее” (или “Оценить”) и переходим к форме для настройки модели оценки.
Здесь можно изменить значения параметров модели. Обычно это “Вес”, “Ключевой параметр”, “Обучить модель”, “Документов для обучения”, “Документов для сравнения”. Изменим их. Значения других параметров подбираются из опыта использования приложения, сейчас оставляем их без изменений. Нажимаем на кнопку “Оценить”. Запускается процесс оценки документа. Через некоторое время появляются результаты.
Видео настройки модели и оценки документа
Просмотр и анализ результатов
На странице результатов Вы видите название оцененного документа, имя модели оценки, категорию и теги документа, дата и время оценки. Далее идет строка по показателю: название показателя, оценки по шкалам (нормализованной, Харрингтона, классической российской), вес показателя, значение и ссылка на рекомендации.
Кликнув по этой ссылке, видим сообщение, что “Степень уникальности содержания документа неудовлетворительна. Необходимо серьезно переработать документ, исключив необоснованные заимствования.” Вообще говоря, в нашем случае это нормально, мы не проверяем уникальность текста рабочей программы, а оцениваем ее относительное сходство с учебниками. Но можно исключить это пугающее сообщение. Для этого нужно установить в параметрах модели диапазон нормативных значений. Например, установить верхнее значение равное 1.0. По умолчанию установлено 0.95. В любом случае кликаем ссылку “Наиболее похожие документы”.
Видим список учебников и их степень сходства с рабочей программой. Делаем предварительный вывод, что учебник в первой строке списка наиболее соответствует содержанию рабочей программы. Поставленная задача самостоятельно выбрать лучший текст решена. Результаты оценки можно распечатать на память.
Настоящие правила использования материалов сайта определяют порядок и условия использования информационных материалов, размещенных на сайте www.ivkconsulting.ru (далее – «Сайт»).
Владельцем данного Сайта является Иванов Владимир Константинович (далее «Владелец сайта»).
Владелец Сайта обладает всеми исключительными правами на использование Сайта и осуществляет указанные права по своему усмотрению, свободно изменяет и дополняет информационные материалы, образующие Сайт, разрешает доступ к Сайту либо ограничивает такой доступ, осуществляет иные принадлежащие ему права в отношении Сайта.
Владелец Сайта осуществляет поддержку Сайта.
Под материалами, размещенными (опубликованными) на Сайте, понимаются тексты, графические материалы, фотографии, видео-, аудио- и иные материалы (далее – «Материалы сайта»). Материалы сайта являются объектами авторского права и охраняются в соответствии с законодательством РФ.
Настоящие правила распространяют свое действие на пользователей Сайта (далее – «Пользователи»), которыми являются физические и юридических лица.
Под использованием Материалов сайта понимается воспроизведение, распространение, публичный показ, сообщение в эфир, сообщение по кабелю, перевод, переработка, доведение до всеобщего сведения и иные способы использования, предусмотренные действующим законодательством РФ.
Пользователи могут использовать Любые Материалы сайта без письменного согласия и на безвозмездной основе при условии, что Пользователь является физическим лицом, и такое использование осуществляется исключительно в личных целях. В иных случаях использование Материалов сайта допускается только с согласия Владельца Сайта.
Коммерческое использование Материалов сайта осуществляется на основании договоров, заключенных в установленном порядке в соответствии с законодательством РФ.
При использовании Материалов сайта в любых целях, кроме личных, ссылка на сайт:
обязательна в печатных изданиях или в иных формах на материальных носителях должна быть указана ссылка на Сайт: www.ivkconsulting.ru.
обязательна в сети Интернет или иных формах использования в электронном виде, должна быть указана гиперссылка на Сайт https://www.ivkconsulting.ru.
должна быть помещена Пользователем в начале используемого текстового материала, непосредственно под используемым аудио-, видео-, фото-, графическим материалом Сайта.
При использовании Материалов сайта не допускается переработка их оригинального текста. Сокращение материала возможно только в случае, если это не приводит к искажению его смысла. Пользователи несут ответственность за искажение смысла материалов Сайта.
Пользуясь Сайтом, вы принимаете и соглашаетесь со всеми вышеуказанными правилами.
II. Ограничение ответственности
Материалы сайта предоставляются «как есть» безо всяких гарантий, включая гарантию применимости в определенных целях, гарантию коммерческой пригодности, и могут содержать технические неточности и типографические ошибки.
Владелец сайта может вносить изменения в Материалы сайта в любое время без предупреждения. Владелец сайта прилагает все усилия для того, чтобы Материалы сайта являлись максимально точными, полными, достоверными и актуальными. Вместе с тем, Владелец сайта не может гарантировать полноты, достоверности и актуальности Материалов сайта.
Владелец сайта не несет ответственности за последствия использования Материалов сайта. Владелец сайта не делает никаких заявлений и не дает никаких гарантий и оценок относительно того, что результаты, описанные в Материалах сайта, будут достигнуты.
Владелец Сайта не имеет каких-либо обязательств по внесению в Материалы сайта исправлений или изменений третьими лицами и не несет какой-либо связанной с этим ответственности.
Владелец сайта не несет ответственности за убытки, возникшие у Пользователей сайта или третьих лиц в результате использования ими Материалов сайта, включая упущенную выгоду.
Владелец сайта не несет ответственности за убытки, возникшие у Пользователей сайта:
по причинам, связанным с техническими сбоями аппаратного и программного обеспечения,
в результате действий Пользователей сайта, явно не соответствующих обычным правилам работы с информацией в сети Интернет.
Ответственность за содержание рекламных материалов, в том числе текстов, баннеров и т.д., размещенных на Сайте, несет рекламодатель.
Владелец сайта не несет ответственность:
за содержание веб-сайтов, на которые даются гиперссылки,
за использование Пользователем материалов, размещенных на веб-сайтах, на которые на Сайте имеются гиперссылки,
за сведения, включая сведения, связанные с регистрацией авторских прав, доступные или полученные через веб-сайты, на которые на Сайте имеются гиперссылки.
Пользуясь Сайтом, вы принимаете и соглашаетесь со всеми вышеуказанными ограничениями ответственности.
Владелец сайта оставляет за собой право изменять настоящие Правила использования материалов и ограничение ответственности в одностороннем порядке в любое время без уведомления Пользователей. Любые изменения будут размещены на Сайте. Изменения вступают в силу с момента их опубликования на Сайте. На данной странице находится действующая редакция Правил.