Вы здесь ▸ Выполненные проекты ▸
Приложение для векторизации и интеллектуального анализа документов “fSimilarity”
Название проекта: Приложение для векторизации и интеллектуального анализа документов “fSimilarity”
Краткая аннотация:
В приложении “fSimilarity” реализуется технология создания векторных представлений документов. Используются модели глубокого обучения “word2vec” и “doc2vec”.
Основные функции приложения:
- Загрузка новых документов для анализа.
- Препроцессинг документов, сохранение результатов в базу данных.
- Векторизация документов выбранного корпуса с использованием обученной модели Doc2Vec.
- Вычисление показателей сходства векторов документов из различных корпусов и сохранение их в базу данных.
- Полный цикл обработки: загрузка документов, их препроцессинг, векторизация и вычисление показателей сходства, сохранение результатов в базу данных.
- Удаление объектов: документов, моделей, векторов, показателей сходства.
- Конвертация форматов документов, просмотр параметров моделей и документов.
Публикации по тематике проекта