level 1
It may be worth a thousand words... but it's not worth 1,000 Kb
Over 90 percent of the information in the world is still on paper. Many of those paper documents include color graphics and/or photographs that represent significant invested value. And almost none of that rich content is on the Internet.
2013年02月01日 09点02分
1
level 1
That's because scanning such documents and getting them onto a Web site has been problematic at best. At the high resolution necessary to ensure the readability of the text and to preserve the quality of the images, file sizes become far too bulky for acceptable download speed. Reducing resolution to achieve satisfactory download speed means forfeiting quality and legibility. Conventional web formats such as JPEG, GIF, and PNG produce prohibitively large image files at decent resolution. As a result, Web site content developers have been largely unable to leverage existing printed materials.
2013年02月01日 09点02分
2
level 1
DjVu (pronounced "déjà vu") is a new image compression technology developed since 1996 at AT&T Labs to solve precisely that problem. DjVu allows the distribution on the Internet of very high resolution images of scanned documents, digital documents, and photographs. DjVu allows content developers to scan high-resolution color pages of books, magazines, catalogs, manuals, newspapers,historical or ancient documents, and make them available on the Web.
2013年02月01日 09点02分
3
level 1
Information that was previously trapped in hard copy form can now be made available to wide audience.
Benefits... and Opportunities
Research institutions, libraries, and government agencies can give access to their archives. Companies can distribute internal documents on their intranets.
The developing and distribution of DjVu technology is now handled by Caminova Inc..
2013年02月01日 09点02分
4
level 1
DjVu is an open standard. The file format specification, as well as an open source implementations of the decoder (and part of the encoder) are available.
The Next Generation Compression Technologies
DjVu typically achieves compression ratios about 5 to 10 times better than existing methods such as JPEG and GIF for color documents, and 3 to 8 times than TIFF for black and white documents.
Scanned pages at 300 DPI in full color can be compressed down to 30 to 100KB files from 25MB.. Black-and-white pages at 300 DPI typically occupy 5 to 30KB when compressed.
2013年02月01日 09点02分
5
level 1
This puts the size of high-quality scanned pages within the realm of an average HTML page (which is typically around 50KB).
For color document images that contain both text and pictures, DjVu files are typically 5 to 10 times smaller than JPEG at similar quality. For black-and-white pages, DjVu files are typically 10 to 20 times smaller than JPEG and five times smaller than GIF. DjVu files are also about 3 to 8 times smaller than black and white PDF files produced from scanned documents (scanned documents in color are impractical in PDF).
In addition to scanned documents, DjVu can also be applied to documents produced electronically in formats such as Adobe's PostScript or PDF. In that case, the file sizes are between 15 to 20KB per page at 300 DPI.
2013年02月01日 09点02分
6
level 1
The DjVu plug-in is available for standard Web browsers on various platforms. The DjVu plug-in allows for easy panning and zooming of document images. A unique on the fly decompression technology allows images that normally require 25MB of RAM to be decompressed to require only 2MB of RAM.
Conventional image viewing software decompresses images in their entirety before displaying them. This is impractical for high-resolution document images since they typically go beyond the memory capacity of many PCs, causing excessive disk swapping. DjVu, on the other hand, never decompresses the entire image, but instead keeps the image in memory in a compact form, and decompresses the piece displayed on the screen in real time as the user views the image. Images as large as 2,500 pixels by 3,300 pixels (a standard page image at 300 DPI) can be downloaded and displayed on very low-end PCs.
2013年02月01日 09点02分
7
level 1
The DjVu format is progressive. Users get an initial version of the page very quickly, and the visual quality of the page progressively improves as more bits arrive. For example, the text of a typical magazine page would appear in just three seconds over a 56K
bp
s modem connection. In another second or two, the first versions of the pictures and backgrounds will appear. Then, after a few more seconds, the final full-quality version of the page is completed.
2013年02月01日 09点02分
8
level 1
One of the main technologies behind DjVu is the ability to separate an image into a background layer (i.e., paper texture and pictures) and foreground layer (text and line drawings). Traditional image compression techniques are fine for simple photographs, but they drastically degrade sharp color transitions between adjacent highly contrasted areas - which is why they render type so poorly. By separating the text from the backgrounds, DjVu can keep the text at high resolution (thereby preserving the sharp edges and maximizing legibility), while at the same time compressing the backgrounds and pictures at lower resolution with a wavelet-based compression technique. DjVu is used by many commercial and non-commercial web sites on the Web today.
2013年02月01日 09点02分
9
level 1
DjVu(读作déjà vu)是一种计算机文件格式,主要用于存储扫描的文档。这种格式的特色包括图像分层、渐进载入、算术编码、对二进制图像进行有损压缩,从而以较小的空间,存放高质量的可读图像。渐进载入使得DjVu适合于应用于因特网。DjVu对于大部分的扫描文档,表现都优于PDF,故被作为PDF的替代品来进行推广。这种格式已经在文件共享网络中,被广泛使用于分发数学书籍。跟PDF类似,DjVu也可以包含光学文字识别的文本层,这样就可以使用复制与粘贴操作。DjVu技术最初由AT&T实验室的Yann Le Cun、Léon Bottou、Patrick Haffner和Paul G. Howard于1996年开发。DjVu是一种开放的文件格式,文件格式规范与参考库的源代码都公开发布。商业开发的所有权几年来被转给了不同的公司,包括AT&T和LizardTech。原来作者维护一个GPL实现/实现,称为DjVuLibre。2002年,DjVu文件格式(还有TIFF和PDF格式)被Internet Archive的百万书籍工程选中,作为公有领域书籍扫描后上线的格式。
2013年02月01日 09点02分
10
level 1
DjVu (デジャヴ)は画像圧缩方式、およびその技术を使った文书形式の名称である。1996年に AT&T で开発され、米国LizardTech社、日本を拠点とするセラーテムテクノロジー(LizardTechは现在、セラーテムの伞下)を経て、现在はカミノバから贩売されている。
2013年02月02日 07点02分
11
level 1
DjVu (от фр. déjà vu — «уже виденное») — технология сжатия изображений с потерями, разработанная специально для хранения сканированных документов — книг, журналов, рукописей и прочее, где обилие формул, схем, рисунков и рукописных символов делает чрезвычайно трудоёмким их полноценное распознавание. Также является эффективным решением, если необходимо передать все нюансы оформления, например, исторических документов, где важное значение имеет не только содержание, но и цвет и фактура бумаги; дефекты пергамента: трещинки, следы от складывания; исправления, кляксы, отпечатки пальцев; следы, оставленные другими предметами и т. д. DjVu стал основой для нескольких библиотек научных книг. Он довольно популярен, и в нём делается большое количество разных документов. Формат оптимизирован для передачи по сети таким образом, что страницу можно просматривать ещё до завершения загрузки файла. DjVu-файл может содержать текстовый слой, что позволяет осуществлять полнотекстовый поиск по файлу. Кроме того, DjVu-файл может содержать встроенное интерактивное оглавление и активные области — ссылки, что позволяет реализовать удобную навигацию в DjVu-книгах.
2013年02月02日 07点02分
12
level 1
DjVu (вимовляється «дежавю́», від фр. déjà vu — дежавю — колись вже бачене) — технологія стискання зображення з втратами, розроблене компанією AT&T спеціально для зберігання відсканованих документів — книг, журналів, рукописів та ін. , де наявна велика кількість формул, схем, рисунків та рукописних символів, котрі роблять повноцінне розпізнавання такого документа надзвичайно складним та трудоємним. Також це дуже ефективне рішення, коли необхідно передати всі особливості оформлення документа. Наприклад в історичних документах важливим є не тільки зміст, а й колір, фактура паперу, його дефекти: тріщини, сліди від згинів, клякси, залишені сліди предметів тощо. В основі формату DjVu лежить декілька технологій, розроблених в компанії AT&T. Зокрема: алгоритм відокремлення тексту від фону на відсканованих зображеннях; хвильовий (вейвлетний) алгоритм стискання фону IW44; алгоритм стискання чорно-білого зображення JB2; універсальний алгоритм стискання ZP; алгоритм розпакування «на запит»; алгоритм «маскування» зображень. В процесі перекодування в DjVu-формат використовується технологія розділення вихідного зображення на три шари: передній план, фон та чорно-білу маску. До кожного з цих шарів застосовуються власні алгоритми стискання.
2013年02月02日 07点02分
13
level 1
DjVu (phát âm như déjà vu trong tiếng Pháp) là một định dạng file trên máy tính, được tạo ra chủ yếu để lưu trữ các ảnh được quét, đặc biệt là ảnh có chứa văn bản và các đường vẽ thẳng. Nó sử dụng các kĩ thuật như phân chia văn bản và ảnh nền trong các lớp ảnh, mã hoá số học (một phương thức nén không mất dữ liệu), nén mất dữ liệu với ảnh đen trắng. Nó cho phép lưu trữ các ảnh chất lượng cao, có thể đọc được mà chỉ chiếm dung lượng tối thiểu, do đó có thể sử dụng trên web. DjVu hướng tới trở thành một định dạng để thay thế cho PDF, thực tế là hiệu quả hơn PDF trong hầu hết các tài liệu được quét. Các nhà phát triển của DjVu đưa ra số liệu khi nén với chuẩn này một trang tạp chí màu mất 40–70KB, tài liệu kĩ thuật đen trắng khoảng 15–40KB, và các chữ viết tay cổ khoảng 100KB. Tất cả đều nhỏ hơn khá nhiều kích thước một ảnh JPEG xem được (thường khoảng 500KB). Giống như PDF, DjVu có thể chứa một lớp văn bản đã được nhận dạng (OCR), giúp cho người dùng có thể sao chép và thực hiện các thao tác khác với văn bản một cách dễ dàng.
2013年02月02日 07点02分
14
level 1
DjVu (uttalas deja-vu) är ett bildfilformat för datorer anpassat för inscannade bilder, särskilt de som innehåller text eller tecknade linjer. Bland dess funktioner finns lagerseparering av text och bakgrund/bilder, progressiv inläsning, aritmetisk kodning och "destruktiv" komprimering för tvåtonade bilder. DjVu har setts som ett alternativ till PDF-formatet och utvecklades av Yann Le Cun, Léon Bottou, Patrick Haffner och Paul G. Howard vid AT&T Laboratories 1996. Största skillnaden mellan DjVu och PDF är att DjVu är ett rastergrafikformat medan PDF är ett vektoriserat format. DjVu är ett så kallat fritt filformat vilket innebär att man inte behöver betala något för att använda det. De ursprungliga upphovspersonerna underhåller en tillämpning släppt under GPL-licens som heter DjVuLibre.
2013年02月02日 07点02分
15
level 1
DjVu (phát âm như déjà vu trong tiếng Pháp) là một định dạng file trên máy tính, được tạo ra chủ yếu để lưu trữ các ảnh được quét, đặc biệt là ảnh có chứa văn bản và các đường vẽ thẳng. Nó sử dụng các kĩ thuật như phân chia văn bản và ảnh nền trong các lớp ảnh, mã hoá số học (một phương thức nén không mất dữ liệu), nén mất dữ liệu với ảnh đen trắng. Nó cho phép lưu trữ các ảnh chất lượng cao, có thể đọc được mà chỉ chiếm dung lượng tối thiểu, do đó có thể sử dụng trên web.
2013年02月02日 07点02分
16
level 1
DjVu is a computer file format designed primarily to store scanned documents, especially those containing a combination of text, line drawings, and photographs. It uses technologies such as image layer separation of text and background/images, progressive loading, arithmetic coding, and lossy compression for bitonal images. This allows for high-quality, readable images to be stored in a minimum of space, so that they can be made available on the web.
2013年02月02日 07点02分
17
level 1
DjVu es un formato de archivo informático diseñado principalmente para almacenar imágenes escaneadas. Se caracteriza por incorporar avanzadas tecnologías tales como separación de capas de imágenes, carga progresiva, codificación aritmética y compresión con pérdida para imágenes bitonales (dos colores), permitiendo que imágenes de alta calidad se almacenen en un mínimo de espacio. La carga (o descarga) progresiva hace al formato ideal para imágenes servidas desde Internet.
2013年02月02日 07点02分
18
level 1
DjVu on vapaa tiedostomuoto, joka on suunniteltu skannatuille kuville, erityisesti tekstiä tai viivoja sisältäville kuville. Tiedostomuodon ominaisuuksia on esimerkiksi kuvan eri kerrosten, kuten tekstin, kuvien ja taustan erottaminen toisistaan, progressiivinen lataus, aritmeettinen koodaus ja mahdollisuus pakata kuvia häviöllisesti. DjVu:lla voidaan pakata kuvia samalla tavalla kuin PDF:lläkin, mutta DjVu:lla pakatut kuvat vievät yleensä vähemmän tilaa.
2013年02月02日 07点02分
19
level 1
A DjVu egy számítógépes fájlformátum, amelyet főleg szkennelt képek tárolására terveztek. Jó alternatívát jelenthet a PDF-fel szemben, mivel a beolvasott dokumentumokat általában kisebb fájlméret mellett képes eltárolni, ezzel megfelel az interneten történő publikációra. A PDF-hez hasonlóan a DjVu is képes szöveges réteget tárolni a dokumentumban, ezzel lehetővé teszi a keresést és a vágólapra másolást.
2013年02月02日 07点02分
20