Инструменты:
rusvectores: семантические модели для русского языка
youtokentome: инструмент для быстрой токенизации текста от команды ВК
Список популярных датасетов
Вики ACL Anthology
Вики ACL: раздел с задачами
Статьи:
scholar.google.com
arxiv.org
arxiv-sanity.org
paperswithcode.com
Блоги ученых:
Ruder.io
Блоги компаний:
OpenAI блог
Google AI блог
Facebook AI Research (FAIR) блог
Другие интересные ресурсы:
NLPub
NeuroNuggets
distill.pub
Очень крутой сборник ресурсов по NLP:
NLP Awesome List
Облачные сервисы:
Github Student Pack
Microsoft Azure для учащихся
AWS Educate
К сожалению, у нас пока нет статистики ответов на данный вопрос,
но мы работаем над этим.