Приложение для векторизации и интеллектуального анализа документов “fSimilarity”

Название проекта: Приложение для векторизации и интеллектуального анализа документов “fSimilarity”

Краткая аннотация:

В приложении “fSimilarity” реализуется технология создания векторных представлений документов. Используются модели глубокого обучения “word2vec” и “doc2vec”.

Основные функции приложения:

  • Загрузка новых документов для анализа.
  • Препроцессинг документов, сохранение результатов в базу данных.
  • Векторизация документов выбранного корпуса с использованием обученной модели Doc2Vec.
  • Вычисление показателей сходства векторов документов из различных корпусов и сохранение их в базу данных.
  • Полный цикл обработки: загрузка документов, их препроцессинг, векторизация и вычисление показателей сходства, сохранение результатов в базу данных.
  • Удаление объектов: документов, моделей, векторов, показателей сходства.
  • Конвертация форматов документов, просмотр параметров моделей и документов.

Ответить

Ваш адрес email не будет опубликован. Обязательные поля помечены *