Dokumentenscanner Toshiba (Karteikarten)
From GBIF.DE IT Wiki
Contents
Workflow Digitalisierung Karteikarten
- Ausgangsmaterial: Sammlungsbeschreibung zu ca.7000 auf ca. 12.500 DIN A6 Karteikarten (Maschinenbeschrieben/Handschrift) mit Daten zu Probennahme, Isolation, Wuchsverhalten auf div. Kulturmedien und weiteren Informationen zu Morphologie und Physiologie
- Alle Karteikarten der Sammlungsbeschreibung werden nach taxonomischen Rang "Genus" aufgeteilt. Die Ordnerhierarchie und der Dateiname setzen sich beim Speichern der TIFF Dateien aus diesen Informationen, interner Laborbezeichnung und laufender Nummer zusammen. Ordner-/Dateipfade werden begleitend in MySQL Datenbank gespeichert.
- Karteikarten mit automatischem Einzug des Scanner Digitalisieren (TIFF 300 DPI Graustufe)
- Texterkennung in Batchverarbeitung mit der Software OmniPage der Firma Nuance zu TXT und RTF Dateien
- Überführung der Inhalte in Datenbankinhalt: Nachgelagerte Verarbeitung durch speziel für diesen Textkörper entwickelte Text Mining Applikation
Hardware
Toshiba e-Studio 500er Reihe
- Auflösung Max. 600 x 600 dpi, 8 Bit pro Farbkanal
- Scangeschwindigkeit: Max. 80/77 Seiten/Minute (S/W/Farbe), 300 dpi
- Dokumenteneinzug: 100 Blatt, A5R-A3, 35-209 g/m²
- Scanmodi Text, Text/Foto, Foto, Graustufen
- Ausgabedateiformate: JPEG, Multi/Single Page TIFF/XPS/PDF, Slim PDF, Secure PDF, durchsuchbares PDF, DOC, XLS, RTF, TXT
- Scanfunktionen Web Services Scan (Pull/Push), Scan to USB, Scan to E-Mail, Scan to File (SMB, FTP, FTPS, IPX/SPX, lokal), Scan to Box (e-Filing), TWAIN1.7/1.8/1.9
Digitalisierungs Arbeitsstation (PC + Software)
- Texterkennungssoftware OmniPage der Firma Nuance
- MS Windows 7
- Adobe Photoshop CS4
- MySQL database + phpMyAdmin
- Intel Core i3-2310M 2.10 GHz
- 3.1 GB RAM
- 500 GB hard disk
- 1428 MB Graphic Card
Speicherserver and Backup
- CIFS share auf Netzwerk gebundenem Speichersystem (NAS: EMC Celerra NS120 80TB)
- Backup via NDM Protokoll auf LTO5 Bandbibliothek (Dell ML6000)