CS YATI – это нейросеть, осуществляющая поиск для Яндекса. Это новая модель, которая прошла обучение на документах, разработанных для IT-специалистов, и работе экспертов, специализирующихся на программировании.
Благодаря этому инструменту поисковая выдача для разработчиков и ML-специалистов стала усовершенствованной и качественной, а навигация по запросам пользователей – удобной и максимально релевантной.
Предыдущая версия YATI учитывала в полтора раза меньше информации с каждой страницы, а значит, обновлённая система помогла лучше оценить качество и релевантность представленных страниц и сайтов. Нейросеть пропустила через себя миллионы и миллиарды документов и страниц о программировании, после чего научилась предсказывать клики квалифицированных программистов. В итоге ответ системы получился максимально релевантным запросу.
Но Яндекс и на этом не остановился. Он доработал обогащённый ответ Stack Overflow. Теперь прямо в результате выдачи поисковика на определённый запрос пользователя, в окне появляется помимо перечня релевантных страниц дополнительная информация. Это будет сам вопрос, а также лучший данный на него ответ и комментарии, которые могут быть полезны программистам. Улучшилось и отображение сниппетов, туда тоже была добавлена дополнительная полезная информация.
Стоит отметить, что большая часть запросов квалифицированными программистами задаются на английском языке. А потому новая нейросеть Яндекса проходила обучение на англоязычных источниках, что еще лучше отразилось на качестве работы сервиса.
С 2020 года платформа запустила технологию анализа текста, которая используется до сих пор. В её основе – применение нейросетей-трансформеров. Эти инструменты требуют огромных ресурсов от системы, но отлично справляются с решением задач, связанных с обработкой естественного языка. Теперь поисковой системе Яндекс стало намного проще оценивать смысловые взаимосвязи между запросами пользователей и содержанием предлагаемых ею в выдаче страниц. И это стало грандиозным событием последних лет, потому что поиск в интернете вышел на значительно более высокий уровень, чем это было раньше.