niedziela, 21 sierpnia 2016

Gimagereader-qt5 - OCR zbudowany w oparciu o Qt5

W AUR istnieje skrypt umożliwiający budowę Gimagereadera - programu OCR dla linuksa, opartego o silnik tesseract. Niemniej jednak jest to wersja zbudowana w oparciu o biblioteki Gtk. Źródła programu umożliwiają jednak również budowę opartą o Qt5. Także qtspell, używany przez program może być zbudowany na podstawie Qt5 (a nie, jak w AUR, w oparciu o Qt4). Tym samym możemy się pokusić o zbudowanie aplikacji OCR, która będzie się zachowywać natywnie w środowiskach opartych o Qt5 (Plasma, LXQT, a także takich jak np. Hawaii).
Załączam paczkę, która składa się z dwu katalogów. Po rozpakowaniu otrzymamy katalogi:
gimagereader/qtspell-qt5
gimagereader/gimagereader-qt5
zawierające PKGBUILDy.
Budując aplikację musimy zachować kolejność. Najpierw zatem budujemy paczkę qtspell-qt5, a następnie gimagereader-qt5.
Zgodnie z zasadami panującymi w Archu, gimagereader-qt5 jako zależność ma wyłącznie silnik OCR - tesseract, ale już nie paczki ze słownikami. Chcąc zatem skorzystać z możliwości aplikacji musimy również doinstalować odpowiednią paczkę tesseract-data-* (np. dla języka polskiego będzie to tesseract-data-pol). Powinniśmy również ustawić odpowiednio zmienną TESSDATA_PREFIX dla tesseracta.