4 безплатни онлайн инструмента за разпознаване на текст, поставени на крайния тест

4 безплатни онлайн инструмента за разпознаване на текст, поставени на крайния тест

Ако искате да конвертирате всеки отпечатан текст в цифров текст, който можете да копирате, поставите, редактирате и търсите, ще трябва да използвате скенери за оптично разпознаване на символи (OCR).





Когато решите да сканирате или направите снимка на документ, той ще бъде записан във формат като JPEG или PDF. OCR софтуер след това може да разпознае буквите и цифрите в тези документи и да ги преобразува в PDF с възможност за търсене или във файл, който можете да редактирате в програми като Microsoft Word.





Проблемът е, че някои OCR скенери работят много по -добре от други, като най -добрите са доста тежки за портфейла.





Omnipage18 например, струва $ 150, но е особено добър в разпознаването на различни езици. Adobe Acrobat Pro DC струва невероятни 400 долара, но има невероятна точност. ABBYY FineReader струва $ 150, но е фантастичен при превръщането на документи като списания и брошури в текст за търсене. По -нататък в тази статия ще тестваме онлайн предлагането на ABBYY.

Ако обаче търсите безплатни алтернативи, можете Изтегли и да използвате в Windows или OS X, трябва да изпробвате тези OCR инструменти. Но ако предпочитате да използвате безплатно, на линия OCR инструмент, продължавайте да четете, тъй като сме изпробвали първите няколко, с резултатите по -долу.



Тестът

Изглежда, че повечето хора сега използват своите смартфони, за да ги сканират, реших да използвам Приложението за сканиране на Evernote (Безплатно за iOS и Android). Сканирах първата страница на Ричард Докин Изкачване на връх Невероятно , за да видим какви резултати бихме могли да постигнем с много основно форматиране. Сканирах и страница на „Тим Ферис“ Четиричасовият готвач да изпробвате скенерите с малко по -сложно форматиране. Запазих всеки от тези файлове като PDF.

След това тези документи бяха пуснати през някои от предполагаемите най -добрите онлайн инструменти за OCR, за да се види колко добре се справят.





Безплатен онлайн OCR [Вече не е наличен]

За щастие не е необходима регистрация за използване на безплатно онлайн разпознаване на текст. И аз бях двойно впечатлен, когато видях искането им да запазят форматирането и оформлението на моя документ.

Сайтът твърди, че може да поддържа PDF, GIF, BMP, JPEG, TIFF и PNG като вход. Изходите могат да бъдат или DOC, PDF текстов документ, RTF и TXT. За съжаление не можах да разбера дали имат ограничение за размера на файла.





Основен документ в PDF

Преобразуван абсолютно перфектно. Няма какво повече да се каже! Тръгваме към а много добро начало.

Основен документ към DOC

Действителните думи изглежда са се преобразували безупречно, с изключение на „ount“ от „Mount Rushmore“ по някакъв начин AWOL. Форматирането обаче е различна история. Много запетаи бяха заменени с подчертаване и случайни интервали бяха вмъкнати в точките в целия документ. Когато по -късно видите как се справя премиум софтуерът в този тест, това не е лошо усилие изобщо .

Сложен документ в PDF

Сложен документ към DOC

Този път преобразуването отне само 10 секунди, като текстът отново бе преобразуван с около 95% точност. Имаше някои странни проблеми с разстоянията и софтуерът имаше проблеми с преобразуването на шрифта в горния десен ъгъл на документа и пропусна няколко символа тук и там.

Присъда

i2OCR

i2OCR прави някои впечатляващи твърдения. Инструментът разпознава над 60 езика, може да обработва оформления с няколко колони (чрез премахване на форматирането), няма ограничения за размера на файла, може да конвертира качени файлове и от URL адреси. И не е нужно да се регистрирате, за да използвате този инструмент.

Услугата работи, като просто извлича текста от изображението ви, след което извежда неформатиран текст. Можете бързо да коригирате всички грешки в страничния изглед, преди да копирате текста в други програми или да изтеглите като DOC, PDF или HTML.

Забележка: когато се опитах да кача своите PDF документи, те бяха отхвърлени от i2OCR, така че трябваше да ги конвертирам в JPEG (като направя екранна снимка на тях, след това кача файловете).

Основен документ за обикновен текст

Сложен документ към обикновен текст

По -голямата част от текста беше преобразуван без твърде много грешки, освен заглавието и рецептата горе вдясно, което беше нечетливо за този инструмент. Начинът, по който колоните са преобразувани в обикновен текст, далеч не е идеален. Ако искате да направите това преобразуване работещо, ще е необходимо много време, за да пренаредите редовете в последователни изречения.

Присъда

Онлайн OCR

Онлайн OCR в момента поддържа 46 различни езика и може да конвертира PDF, JPG, BMP, TIFF и GIF във формат Word, Excel или обикновен текст. Сайтът твърди, че „преобразуваните документи изглеждат точно като оригинала - таблици, колони и графики“.

Версията, която можете да използвате без регистрация, ви позволява да конвертирате до 15 изображения на час (ограничение от 5 MB). Ако се регистрирате за акаунт, можете да закупите повече страници над това ограничение, като същевременно можете да конвертирате многостранични документи и ZIP архиви.

Основен документ към DOC

Основният документ бе преобразуван безупречно без римската цифра Аз не се качват. Както обеща сайтът, форматирането беше точно както беше в книгата. Браво на този инструмент.

Сложен документ към DOC

След като бях разочарован от предишните инструменти за OCR при преобразуването на сложния документ, бях силно впечатлен от онлайн OCR. Оформлението беше почти перфектно, както можете да видите по -горе. За пореден път рецептата не беше подбрана прекалено добре, но всякакви други дребни грешки бяха пренебрежими.

Присъда

Абсолютно фантастични резултати от онлайн OCR. Единственият недостатък, който виждам, е, че няма начин да изтеглите преобразуваните документи като PDF, тъй като споменатите изходни формати включват само DOCX, XLSX и TXT.

ABBYY FineReader Online (10-страничен пробен период)

Както бе споменато по -рано, ABBYY е един от лидерите на пазара на OCR софтуер, струващ около $ 150 за тяхната пълна програма за изтегляне. Те предлагат а 10-страничен безплатен пробен период за техния онлайн инструмент (изисква се регистрация). За абонамент от $ 5 техният онлайн инструмент ще ви позволи да конвертирате 200 страници всеки месец.

Приетите файлове могат да бъдат до 100mb, във всеки от тези формати: PDF, JPG, JPEG, TIF, TIFF, PCX, DCX, BMP и PNG. ABBYY разпознава и почти 200 езика. Изходите са особено впечатляващи с избор между DOCX, XLSX, RTF, TXT, PPTX, ODT, PDF, FB2 и EPUB.

Можете дори да изпробвате няколко BETA функции по време на пробния период. Първият е възможността да преведете документа си на друг език. Другото е да експортирате конвертирания си документ в акаунта си за съхранение в облак, независимо дали това е Dropbox, Google Drive, Evernote, Microsoft OneDrive или Box.

Основен документ за DOCX

Сложен документ към DOCX

Веднъж преобразуван, имаше много малко грешки в текста в документа (с изключение на OCR, който отново се бори с шрифта на тази рецепта!), Но форматирането остави много да се желае.

Трите колони по някакъв начин заемат две страници, като централната колона само се появява на втората страница. Ако наистина искаш направете всичко с този преобразуван документ, в крайна сметка ще си издърпате косата.

Основен документ в PDF

Сложен документ в PDF

Присъда

Крайният резултат

Ако, както повечето хора, просто търсите да сканирате няколко статии от списания и някои сметки за домакинството, няма да е необходимо да редактирате тези документи. Следователно преобразуването директно в PDF ще бъде подходящо за вас, тъй като все още ще можете да търсите в тези документи. За това безплатният онлайн OCR определено беше най -добрият безплатен инструмент, който тествахме. Като се има предвид това, ако сте готови да плащате $ 5 на месец за почти съвършенство, FineReader на ABBYY онлайн беше малко по -точен.

Що се отнася до конвертирането на документи в DOC, не успяхме да намерим идеално решение, но най -добрите резултати дойдоха от Онлайн OCR . Преобразуването не беше перфектно, но целостта на форматирането до голяма степен беше запазена непокътната, а грешките бяха незначителни. Когато сравним тези резултати с „първокласното“ предложение на ABBYY, няма как да не останете силно впечатлени.

Не включихме възможностите за разпознаване на текст на Google Диск в тази публикация; малко за навсякъде в Google, но повече за факта, че искахме да тестваме няколко други безплатни онлайн OCR услуги там.

Към вас: Кои други онлайн инструменти за OCR бихте препоръчали на нашите читатели? И кои сте опитвали, които никога повече няма да използвате?

Дял Дял Туит електронна поща Ръководство за начинаещи по анимиране на реч

Анимирането на реч може да бъде предизвикателство. Ако сте готови да започнете да добавяте диалог към вашия проект, ние ще разбием процеса вместо вас.

как да ускорите интернет на телефона на android
Прочетете Напред Свързани теми
  • интернет
  • Производителност
  • Преобразуване на файлове
  • OCR
За автора Роб Найтингейл(272 статии са публикувани)

Роб Найтингейл е завършил философия от Университета в Йорк, Великобритания. Той е работил като мениджър и консултант в социалните медии повече от пет години, като същевременно е провеждал семинари в няколко страни. През последните две години Роб също е писател на технологии и е мениджър на социалните медии на MakeUseOf и редактор на бюлетини. Обикновено ще го намерите да пътува по света, да се учи на видеомонтаж и да експериментира с фотография.

Още от Роб Найтингейл

Абонирайте се за нашия бюлетин

Присъединете се към нашия бюлетин за технически съвети, рецензии, безплатни електронни книги и изключителни оферти!

Щракнете тук, за да се абонирате