Вы здесь ▸ Исследования ▸
Мои ранние разработки: о пользе взглядов в перспективу
Хочу показать четыре своих статьи, которые были опубликованы в 2012-2013 гг. То, чем я занимаюсь сейчас, пришло ко мне не вчера и не год-два-три назад. Разработка векторных моделей, векторизация документов, создание их эмбеддингов – я начал осваивать эти технологии уже тогда. Причем я параллельно нарабатывал практику их применения для решения конкретных задач. Это касалось, главным образом, образовательной сферы, так как я тогда работал в университете.
Контекст
Все работы, результаты которых описаны в обсуждаемых здесь статьях, выполнялись в рамках проектов (включая предпроектные исследования):
- Создание, внедрение и развитие электронной информационно-образовательной среды в университете
- Интеллектуальная система информационной поддержки инноваций в науке и образовании.
О чем эти статьи?
Статья [1] была представлена на конференции по технологическому обеспечению и содержала описания критериев и базисных моделей для интегральной оценки электронных документов применительно к результатам выполнения студентами учебных заданий. Такая система критериев могла бы служить основой для реализации автоматизированного контроля выполнения заданий в образовательных технологиях. В статье были приведены сведения о реализации описываемых подходов.
Статья [2] была опубликована в сборнике материалов конфереции по качеству образовательных ресурсов. Содержала результаты моих разработок, аналогичные описанным в предыдущей статье, но с акцентом на использование разработанных технологий и продуктов для повышения качества учебных материалов.
Статья [3] опубликована в журнале Вестник ТвГТУ и обосновывала и обобщала подход к использованию набора критериев для интегральной оценки электронных документов при подготовке принятия решений. Тем самым развивала идеи изложенные в первых двух статьях.
Статья [4] была представлена на конференции по качеству образовательных процессов и посвящена описанию решения конкретной задачи – оценки заимствованиям в студенческих работах и обеспечению их уникальности. В частности, рассматривались контексты заимствования материалов и описывалось итоги применения инструментария, представленного ранее.
Результаты разработок
Результаты разработок, описанные в приведенных выше статьях, включали:
- Систему критериев для интегральной оценки документов:
- Функциональные критерии: наличие семантического содержания, похожесть, читабельность.
- Структурные критерии: завершенность структуры, объем, формат хранения.
- Обоснование использования базовой модели векторного пространства документов (МВП) для реализации большинства функциональных критериев.
- Определение областей применения критериев интегральной оценки документов.
- Разработку программной платформы для анализа документов Document Text Analyzer (DTA) со следующими основными функциями:
- Очистка текста и морфологический анализ документов.
- Лемматизация текстов документов.
- Построение и поддержка МВП, включая расчеты метрики TF*IDF оригинальными алгоритмами.
- Вычисление степени сходства документов с помощью косинусной меры близости векторов.
- Поддержка базы данных для хранения документов и результатов их обработки и анализа.
- Формирование расширяемого набора предопределенных отчетов из базы данных.
Сравниваем с тем, что актуально сейчас
Все эти результаты через 10 лет трансформировались в приложение Текстоматика. Конечно, алгоритмы и платформы изменились, разработка векторных моделей перешла на новый уровень. Были ASP, C#, MS SQL Server, собственная реализация МВП. Стали PHP, Python, MariaDB Server, Gensim/Word2Vec/Doc2Vec. Функциональность DTA и Текстоматика несравнимы. Скорость работы алгоритмов также существенно увеличилась.
Но понимание целей, областей применения и актуальности разработок в целом осталось прежним.
Когда это все начиналось было интересно смотреть на реакцию причастных. То, как был устроен и работал DTA, студенты сначала не понимали, после моих разъяснений и демонстраций признавали достоверность результатов, некоторым даже нравилось. Правда не всем, уличенным в плагиате было не по себе. С моей стороны к ним была, как бы сейчас сказали, нулевая терпимость. А преподаватели мало что понимали в вопросах этой самой интеллектуальной обработки текстов. Относились к моим технологиям индифферентно. Через 10 лет отношение студентов практически не изменилось. А преподаватели стали присматриваться, удивлялись результатам, задумывались.
Разработки на перспективу. Заключение
Какие выводы я делаю из этой истории? Они кажутся достаточно очевидными, но повторить не мешает. Как показывает жизненный опыт, не все очевидное обязательно реализуется.
Во-первых, не стоит придавать большого значения безразличному или, в предельном случае, негативному отношению окружающих к инновациям. Это типично.
Во-вторых, указанное отношение следует обратить на пользу. Например, включить в разработку функциональность, вызывающую повышенный интерес. Или больше внимания уделить презентационной части разработки.
В-третьих, для получения действительно значимого результата надо пройти весь путь: понять разработку изнутри, совершить некоторое число ошибок, перепробовать не один подход и т.п. Другими словами, через тернии…
И, в-четвертых, другого способа приобрести и/или повысить собственную квалификацию я не вижу. Только через собственные идеи, собственные разработки, собственные внедрения,
Источники
- (2012): Критерии и модели для комплексной оценки качества электронных учебных материалов. Опубликовано в: Сборник докладов Международной интернет-конференции "Информационно-технологическое обеспечение образовательного процесса государств-участников СНГ". От идеи к практике: ЭУМК, виртуальные лаборатории и кабинеты, С. 257-263, Минск: БГУ, 2012, ISBN: 9789855187661, (Иванов В.К. Критерии и модели для комплексной оценки качества электронных учебных материалов // cтатья в сборнике докладов Международной интернет-конференции "Информационно-технологическое обеспечение образовательного процесса государств-участников СНГ". От идеи к практике: ЭУМК, виртуальные лаборатории и кабинеты. - Минск: БГУ. - 2012. - C. 257-263,).
- (2012): Критерии и модели для мониторинга качества электронных учебных материалов в образовательных технологиях. Опубликовано в: Сборник докладов научно-практической конференции «Система гарантий качества образования: разработка и внедрение», 30 октября 2012 г., Тверь: ТвГТУ, 2012, (Иванов В.К. Критерии и модели для мониторинга качества электронных учебных материалов в образовательных технологиях // В сборнике докладов научно-практической конференции «Система гарантий качества образования: разработка и внедрение», 30 октября 2012 г., Тверь, ТвГТУ. - 2012.).
- (2012): Критерии интегральной оценки электронных документов в системах подготовки принятия решений. Опубликовано в: Вестник Тверского государственного технического университета : науч. рецензир. журнал. - Вып.22., С. 20-26, Тверь: ТвГТУ, 2012, (Иванов В.К. Критерии интегральной оценки электронных документов в системах подготовки принятия решений / Вестник Тверского государственного технического университета : науч. рецензир. журнал. - Вып.22. - С. 20-26. - Тверь, 2012).
- (2013): Особенности анализа сходства документов в различных контекстах заимствования при подготовке текстовых материалов. Опубликовано в: Оценка качества высшего профессионального образования с учетом требований ФГОС и профессиональных стандартов : материалы докладов заоч. науч.-практ. конференции. - Тверь, 2013, С. 19-26, Тверь: ТвГТУ, 2013, (Иванов В.К., Миронов В.И. Особенности анализа сходства документов в различных контекстах заимствования при подготовке текстовых материалов // Оценка качества высшего профессионального образования с учетом требований ФГОС и профессиональных стандартов : материалы докладов заоч. науч.-практ. конференции. - Тверь, 2013. - С. 19-26.).