Изучая .csv файл с оригинальной разметкой рецептов можно наткнуться в частности на такие примеры:
1QTY teaspoonUNIT baking powderNAME
5QTY cupsUNIT kosher or coarse seaCOMMENT saltNAME
1QTY cupUNIT plain lowfatCOMMENT yogurtNAME
В первом примере baking powderNAME (мука для выпекания) выделена в отдельную сущность, тогда как plain lowfatCOMMENT yogurtNAME (обезжиренный йогурт без добавок) и kosher or coarse seaCOMMENT saltNAME (кошерная или крупная морская соль) поделены на раздельные сущности.
Какие из следущих методов можно использовать для принятия решения об объединении нескольких слов в именованную сущность?

К сожалению, у нас пока нет статистики ответов на данный вопрос, но мы работаем над этим.