Алгоритм, который по описанию компании в кратком формате сам строит ключевые слова, запросы для гугла, гуглит, находит компании похожие, с ними делает также несколько раз, и в результате выдаёт подборку сайтов конкурентов. Процесс сбора: переходит по ссылке, собирает данные с сайта, анализирует результаты. Решение на данный момент - это использовать GPT api + плагины для взаимодействия gpt с браузером. Мы потестировали разные подходы, попробовали извлекать названия компаний и ключевые слова с помощью лингвистических моделей, site2vec и т.п. но получилось не очень эффективно. GPT же обладает самой большой обобщающей способностью и контекстным пониманием (все-таки он сейчас SOTA среди всех инструкционных моделей), а использование плагинов для взаимодействия с браузером позволит постоянно обновлять информацию о новых компаниях. С помощью gpt можно искать ключевые слова и компаний-конкурентов, производитель сравнительный анализ и суммаризировать полученную информацию. А разную метадату о компаниях можно получать уже дополнительными алгоритмами парсинга