В этом плане, конечно, у синтетических языков (например, у русского) большой бонус перед аналитическими языками (например, английского) -- сразу, не вникая в смысл, у лексем можно определить род, число, время, степень сравнения и так далее. И уже имея всю эту информацию в зубах, с текстом становится работать намного проще: можно разрешать омонимию, проще рубрицировать текст, и так далее.
Так вот, собственно, вьетнамский язык оказался весьма препаскуднейшим образом аналитическим :( Если взять за эталон счастья компьютерного лингвиста Ифкуиль, то вьетнамский я уже склонен записать в эталон горя.
Вот, например, фраза из учебника, второй урок: Chùng tôi ghi từ -- здесь нихрена нельзя сказать наверняка :) Это может быть: "Я записываю слова", "Я буду записывать слова", "Я записывал слово", "Мы (я и еще один чувак) записывали слово" -- здесь нет ни времени, ни числа, ничего полезного, кроме собственно значения лексем :) Все это добро нужно узнавать "из контекста", а поди еще объясни машине этот контекст...