Форум Восточного портала (http://oriental.ru/cgi-bin/forum/YaBB.pl)
Интересы >> Китайское языкознание >> как оцифровывать китайский текст ...
(Message started by: Сат Абхава на 14.05.03 в 09:16:05)

Заголовок: как оцифровывать китайский текст ...
Прислано участником Сат Абхава на 14.05.03 в 09:16:05
Silevan:

Quote:
У меня небольшая проблема (во всяком случае, надеюсь) - приобрел сканер (сегодня), но вот как его заставить понимать китайский язык еще не знаю   .
Может кто-нибудь какой-нибудь добрый совет подкинет, а ?


Проблема действительно небольшая и лечится легко. Для начала ознакомьтесь с общими рекомендациями по сканированию (см. на http://www.oriental.ru/cgi-bin/forum/YaBB.pl?board=tech;action=display;num=1042290383), а затем я постараюсь подробно разъяснить, что делать с китайским текстом.

Заголовок: Re: как оцифровывать китайский текст ...
Прислано участником silevan на 14.05.03 в 14:04:45
Спасибо огромное !

А то я в результате безуспешных поисков в просторах мировой сети совсем было отчаялся.

Заголовок: Re: как оцифровывать китайский текст ...
Прислано участником Сат Абхава на 15.05.03 в 13:37:39
Теперь необходимо на свой комп установить хороший китайский OCR. Понимаю, что в Ваших краях с этим добром дело обстоит не сладко, а потому иду на откровенный пиратский шаг (пока не получу за это от администратора).

Скачивайте полнофункциональные версии программы "Dan Qing" , это лучшее из всего, что у меня есть, по моим наблюдениям точность распознавания порядка 80%!

Для упрощенной иероглифики:
http://satabhava.oriental.ru/tool/DanQing_simp.zip (3,5 Мб)

Для традиционной иероглифики:
http://satabhava.oriental.ru/tool/DanQing_trad.zip (3,5 Мб)

Распакуйте архивы и запустите Setup в папке Disk1.

Внимание:

1. При инсталляции обеих программ нужно обратить внимание на то, что по умолчанию программы инсталлируются в один и тот же каталог, что приводит к перезаписи некоторых файлов предыдущей программы. Поэтому если в процессе инсталляции каталог перименовать не получится, то сделать это нужно будет сразу после инсталляции первой из программ. Затем только инталлировать вторую.

2. Программы проверены на работоспособность в ОС Win31, Win95, Win98, Win ME. Как они будут вести себя на Win2000 и Win XP, я не знаю.

3. У программ китайский интерфейс, поэтому для русскоязычной Win98, Win ME нужен китаизатор. Я пользуюсь программой "AsianSuite" от Union Way. 2-х месячную версию можно скачать на http://www.unionway.com/tea/html/0/1.html. У меня у самого стоит уже просроченная trial-version, поэтому меняю дату на компе, когда с ней работаю.  :)

И еще по ходу самого распознавания. OCR работает только с графическими файлами форматов .bmp, .tif и .pcx . Графический скан должен быть выполнен исключительно в черно-белом варианте (Line Art), разрешение я всегда выставляю в 300 pd.

Вот, собственно, и все.
Будут вопросы - задавайте. :)

Заголовок: Re: как оцифровывать китайский текст ...
Прислано участником Олег на 15.05.03 в 19:39:16
Не хочу вас огорчать Сат Абхава, то DanQing безнадежно устарел. По двум причинам – версия которую вы выложили – 2.64. А сейчас уже существует 4.00, которая поддерживает оптимизированные файлы из Файн Ридера. Но даже при этом плюсе – качество распознавания ужасно. На данный момент нет ничего лучше ShangShu 尚书. Имеет английский интерфейс, качество распознавания чисто китайского текста процентов этак 90-95, а то и все сто выдает. Работает в ХР. Не требует дополнительных программ по китаизации компа. Единственный минус автоматом переводит полные иероглифы в упрощенные.
Раньше лежала по этим ссылкам. Но сейчас сервер в дауне. Может оживет. Или ищите в Гугле. Объем 45 мег, но стоит того.
ftp://61.159.224.203:9724/cba1999/shocr60.zip
ftp://61.159.224.203:9724/styx/shocr60.zip

Заголовок: Re: как оцифровывать китайский текст ...
Прислано участником Radagor на 02.06.03 в 07:55:20
To Олег
Спасибо что перенаправил меня в эту ветку форума

To ALL
Тоже занят поисками программы которая поможет оцифровать китайский текст

Путем долгих поисков наткнулся на программу DanQing OCR V4.0 Traditional Chinese Gold
вот здесь http://pcsoft.gol.ge/Software%20Download/Other%20SOftware/other_software.htm даже на нее ссылка есть но к сожалению не работает
 
Также есть еще такая программа Readiris Pro 8.0 For PC (котрая достается без проблем) но к ней нужен Asian OCR Add-on - подскажите не встречали ли вы на просторах инета сие творение
 
Нашел в инете что со сканерами Genius ColorPage-HR7X Slim и  ColorPage-HR6X Slim    в комплекте поставки идет - программное обеспечение оптического распознавания иероглифов
Посмотрите плиз у кого сие есть -действительно ли это так и что там за софт

To Олег 
Очень заитересовала программа которую ты предлагаешь но сервер действительно в дауне
Может быть у тебя есть еще варианты где можно достать эту программу или кто -то скачавший ранее может ее выложить для всеобщего пользования
Поиск в гугле ничего конкретного не дает

Заголовок: Re: как оцифровывать китайский текст ...
Прислано участником Олег на 02.06.03 в 08:29:40
尚书OCR 6.0(38.6MB)
TH-OCR 8.0 (31.5MB)

Есть здесь:
http://www.oldrain.com/wuxia/tdxz.html

еще какая-то
TextPro5b5(438KB)

Если скачаешь напиши, что за прога.

Заголовок: Re: как оцифровывать китайский текст ...
Прислано участником Radagor на 03.06.03 в 11:49:11
Олег огромное спасибо за ссылку :)
ShangShu удалось скачать
Подскажи плиз если знаешь есть ли там какие либо ограничения (30 дней, число запусков и т.п.) а то явно вроде не проявляется
Кстати как тебе удалось найти эту ссылку - пробовал много поисковых машин - не получалось
TH-OCR 8.0 - не знаешь что за программа стоит ли ее качать?
TextPro5b5 - скачал посмотрел интрефейс на китайском - похоже на текстовый редактор

Заголовок: Re: как оцифровывать китайский текст ...
Прислано участником Олег на 03.06.03 в 23:25:12
Для Шан-шу у меня есть кряк. Напиши на мыло свой ящик, пришлю. Что касается ТН, то сделана она удобней шаншу, но мороки с ней много. Я так и не смог ее научить показывать иероглифы, когда она распознает текст. Поэтому ничего не могу сказать о качестве распознавания.

Что я вводил в гугл для поиска, честно говоря, уже и не помню.  :) Кажется название проги на китайском.

Заголовок: Re: как оцифровывать китайский текст ...
Прислано участником Олег на 05.06.03 в 22:31:44
Кто уже установил у себя Шан Шу, вероятно заметил, что некоторые поля отображаются некорректно. Уважемый Radagor закинул этот вопрос на специализированный форум. Интересующиеся могут прочитать ответы здесь:
http://forum.ixbt.com/0022/040958.html

Заголовок: Re: как оцифровывать китайский текст ...
Прислано участником Baruchim на 08.07.03 в 13:27:00

on 06/03/03 в 11:49:11, Radagor wrote:
Олег огромное спасибо за ссылку :)
ShangShu удалось скачать
Подскажи плиз если знаешь есть ли там какие либо ограничения (30 дней, число запусков и т.п.) а то явно вроде не проявляется
Кстати как тебе удалось найти эту ссылку - пробовал много поисковых машин - не получалось
TH-OCR 8.0 - не знаешь что за программа стоит ли ее качать?
TextPro5b5 - скачал посмотрел интрефейс на китайском - похоже на текстовый редактор


У меня вопрос к пользователям китайских OCR - есть ли среди них такие программы, что распознают комбинированный текст (например, китайский + английский)? Я тут недавно сделал глупость, купив в Штатах SharpEye 2.0 OCR от Twinbridge Corp., так она мало того, что сделана аж в 1997 году, при попытке загрузить комбинированный текст-скан типа "иероглифы с пиньиньской транскрипцией", вообще ничего не распознаёт.

Заголовок: Re: как оцифровывать китайский текст ...
Прислано участником Andersen на 11.07.03 в 18:15:07
Я тоже перепробовал несколько распознавалок. И тоже (как и Олег) считаю, что по точности Шан Шу лучшая, проигрывая другим в интерфейсе.

Заголовок: Re: как оцифровывать китайский текст ...
Прислано участником DoktorAvtobus на 08.10.06 в 16:46:12
Люди дайте плиз ссылку где можно скачать ShangShu

Заголовок: Re: как оцифровывать китайский текст ...
Прислано участником Vakka на 11.09.07 в 15:41:44
Уважаемые форумчане, не могу найти мануала к ShangShu хотя бы на английском. Буду очень благодарен за описание процесса распознавания китайского текста с ShangShu, в идеале - с картинками.

Заголовок: Re: как оцифровывать китайский текст ...
Прислано участником Shuravi на 12.09.07 в 09:25:36
у меня в покоцанном варианте шангшу-7 хэлпа ваще никакого нет.
чисто методом тыка познаётся желаемое... благо прога не навороченная

хотя установка проги и идёт на английском, для корректной работы программы понадобится либо переключиться на китайскую локаль, либо пользоваться MS AppLocate.

На пальцах:

- запустили программу.
- открыли картинку с текстом (либо сканите текст).
- давите F5 и блоки для распознавания будут автоматом обрисованы.
- давите F8 и текст в выделенных блоках будет распознан.
- давите последовательно Alt - P - F (либо мышкой лезете в меню); откроется диалоговое окно где можно выбрать место для сохранения распознанного текст и формат (TXT, RTF, HTML, XLS)
- тамже слева внизу есть чек-бокс. Если отметить, то сразу после сохранения текста стартует приложениe дефолтовое в вашей системе для выбранного типа файла.

Заголовок: Re: как оцифровывать китайский текст ...
Прислано участником fajh на 14.09.07 в 16:05:24
дайте линк на енту прогу. И . если мона ключик к заветной дверце.

Заголовок: Re: как оцифровывать китайский текст ...
Прислано участником Shuravi на 14.09.07 в 22:21:27
ShangShu7 (http://rapidshare.com/files/55740473/SHOCR7.rar)
ключей не надо

Заголовок: Re: как оцифровывать китайский текст ...
Прислано участником andtorino на 17.11.07 в 10:21:19
Добрый день! Батя попросил программу для распознавания китайского, скачал ShangShu, отдал ему. По его словам, она сканируя текст, распознает его не как китайский, а как английский. Посоветуйте, пожалуйста, в чем может быть проблема?  Сам думаю, либо какие системные настройки, либо может соседство finereeder'a влияет.... ???

Заголовок: Re: как оцифровывать китайский текст ...
Прислано участником akseli на 09.08.08 в 10:48:43
А вот ссылка для всех, кто нуждается в ShangShu 7.0
http://akseli.ucoz.ru/news/2008-08-09-22

Заголовок: Re: как оцифровывать китайский текст ...
Прислано участником chudaster на 23.08.09 в 10:57:22
http://www.verycd.com/topics/24461/
http://www.verycd.com/topics/19761/
качаются emule-ом

Заголовок: Re: как оцифровывать китайский текст ...
Прислано участником sportdoc на 11.01.11 в 16:39:54
chudaster
http://www.verycd.com/topics/24461/
http://www.verycd.com/topics/19761/
качаются emule-ом

Спасибо!



Форум Восточного портала » Проект дизайн-студии Индейское лето, 2000–2010