Господа, я тут немного накодил, в общем, того, добавил беларускую мову в OCR-ку cuneiform.
http://github.com/begemotv2718/cuneiform-by
(после компиляции должно работать с command-line cuneiform -l bel <image>)
Надеюсь, кому-нибудь пригодится. А то, насколько я понимаю, со свободными распознавалками белорусского некоторые проблемы.
Не без багов, конечно, но, как мне кажется, уже в состоянии приносить пользу.
Беларусизация cuneiform
-
- Заглянувший
- Сообщения: 2
- Зарегистрирован: 10 май 2011, 20:06
- Откуда: Минск
- Контактная информация:
Re: Беларусизация cuneiform
В upstream от cuneiform патчи отсылать пробовали? Если работать с Upstream - есть шанс что поддержка распознавания белорусского появится из коробки в дистрибутивах.
-
- Заглянувший
- Сообщения: 2
- Зарегистрирован: 10 май 2011, 20:06
- Откуда: Минск
- Контактная информация:
Re: Беларусизация cuneiform
Пока не пробовал. Попиляю еще немного, проверю, что правильно работает мой словарь.
Re: Беларусизация cuneiform
А cuneiform я пользовался, действительно прорыв в области распознования текста для Linux. Раньше был полностью голяк в OCR.
Re: Беларусизация cuneiform
Ці ёсць навіны?
Калі ёсць, трэба анансаваць тут!
Калі ёсць, трэба анансаваць тут!