به گزارش سرویس فنآوری اطلاعات خبرگزاری دانشجویان ایران (ایسنا)، گوگل بهندرت اسناد ذخیره شده به شكل PDF را كه فورمت فایل ساخت شركت ادوب است در نتایج جستوجو نشان میدهد زیرا راهی برای تشخیص ماهیت این محتوا ندارد اما با آغاز استفادهی گوگل از نرمافزار OCR این امر تغییر خواهد كرد.
به گفتهی مدیر محصول گوگل، این شركت از این فنآوری برای تبدیل اسناد اسكن شده به فایلهای متنی كه قابل جستوجو و ایندكس گذاری هستند و در پاسخ به تقاضاهای جستوجوی گوگل ارایه میشوند استفاده میكند.
غول جستوجوی اینترنت با تبدیل تصاویر متن به متن ایندكس عظیم خود را توسعه میدهد و اسناد PDF تبدیل شده به متن را درصفحهی جستوجو در لینك «مشاهده به شكل HTML» دسترسپذیر میكند.