Von Scan einzelne Werte in Flatfile

Dieses Thema im Forum "Software allgemein" wurde erstellt von DasExperiment, 8. August 2002.

Status des Themas:
Es sind keine weiteren Antworten möglich.
  1. DasExperiment

    DasExperiment Kbyte

    Registriert seit:
    3. Juni 2002
    Beiträge:
    330
    Hallo Leute,

    ich kriege hier an der Arbeit immer eine schöne Liste aus einem Drucker der am Großrechner hängt. Keine direkte Datenübertragung möglich! Leider. Also muß ich die Zahlen wieder in eine Datenbank einklimpern. Sehr nervtötend.
    Idee:
    Einscannen der Liste, auslesen der Zahlen in ein Flatfile. Importieren des Flatfiles per ETL-Tool in die Datenbank.
    Problem:
    Ich hab keine Ahnung ob sowas realisierbar ist. Gibt es OCR Software die ausgelesene Daten in ein Flatfile speichert? Ich kenne leider keine. Wenn nicht, kann sowas mit WENIG Aufwand programmiert werden? Ich kann zwar noch einen Taschenrechner auf Dos Komandozeileneingabe mit Turbo Pascal programmieren, vielleicht auch noch ein paar Sachen in VBA aber nix mehr!
    Das Flatfile importiere ich dann per Script in die Datenbank. Soweit reichts beim Programmieren! :-)
    Würde mich freuen wenn ihr Vorschläge habt wie ich aus einem Scan Zahlen auslese und diese in einer kommaseparierten Textdatei abspeichern kann!

    Vielen Dank

    Matthias

    P.S. Thread in dieser Kategorie weil ich keine Ahnung habe wo sonst!
     
  2. ede

    ede Kbyte

    Registriert seit:
    18. April 2000
    Beiträge:
    296
    Ja, ist ok.
    Nur seit OOP hab ich mich auch nicht mehr so richtig mit der
    Programmierung beschäftigt.
    Beim 6er Word hatte ich mal ne kleine Anwendung programmiert,
    aber beim Portieren auf 97 bin ich in den Anfängen schon ausgestiegen, weil ich dann auch für die Anwendung etwas anderes hatte.
    Also, wenn Du fragen hast, frag ruhig... ich hab auch keine Ahnung :D

    Viel Glück, Ede
     
  3. DasExperiment

    DasExperiment Kbyte

    Registriert seit:
    3. Juni 2002
    Beiträge:
    330
    Salve,

    also besser einmal einen großen Arbeitsaufwand als immer das Handgemurkse!
    Dann werd ich das nach meinem Urlaub wohl mal mit einem Word Makro probieren. Da sehe ich auch mit meinen Programmierkenntnissen (wenn man sie überhaupt so bezeichnen will) keine Probleme. Ein Markro krieg ich auch ohne Makro-Rekorder hin. Solange es nicht wie früher an Zeigern scheitert.
    Am besten würde es mir natürlich schon gefallen als Resultat eine Textdatei zu haben. Mal sehen, in Deinem Profil ist ja eine E-Mail Adresse von Dir, falls ich Probleme kriege und Du nichts dagegen hast werde ich mich mal dann an Dich wenden.

    Nochmal vielen Dank für Deine bisherige Hilfe.
    Bis denn
    Matthias
     
  4. ede

    ede Kbyte

    Registriert seit:
    18. April 2000
    Beiträge:
    296
    Hi Matthias,

    ich sehe schon, eine sehr uneinheitliche Darstellung der Daten.
    Übrigens ist beim HP eine OCR-Software dabei, kannst du aber nur vom Twaintreiber aus ansprechen, wie Du es ja auch machst. Hatte auch mal einen HP ist IIRC Caere Light oder so ähnlich, egal.

    Ich seh\' für Deine Anforderung nur eine Lösung:
    Word-Makro. Da mußt Du aber einen ganz schönen Arbeitsaufwand einkalkulieren.
    NUR: einmal erstellt, nie wieder Handarbeit ;)

    Das Einfachste wäre (in der Annahme das jede Seite genau gleich aussieht)
    Makro-Rekorder einschalten
    die Seite von unnützen Daten befreien
    Seite so aufbauen, dass die benötigten Daten in Reihen und Spalten angeordnet sind (Trenner Tab oder Semikolon)
    Dann "Speichern unter..." Format: MS-DOS-Text.
    Makro-Rekorder abschalten.
    Rechtsklick auf Symbolleiste, Anpassen, Makros, erstelltes Makro auf Word-Symbolleiste ziehen.
    Scannen, in Word auf Schaltfläche für Makro klicken und hoffen, dass alles passt ;)

    Man kann als 2. Lösung mit dem Makro-Editor auch ein Makro programmieren, das die Daten aus dem Dokument entnimmt und sequenziell in eine TXT-Datei schreibt.
    Das heißt allerdings wirklich programmieren, somit etwas Kenntnisse mit OOP und der MS-VB-Synax :(

    HTH Ede
     
  5. DasExperiment

    DasExperiment Kbyte

    Registriert seit:
    3. Juni 2002
    Beiträge:
    330
    Hi Ede,

    leider ist die Liste zum Einscannen ziemlich blöd aufgebaut. Ist eine Personalliste. Eine Kopfzeile mit Beschreibung des Spalteninhaltes(uninteressant), erste Spalte Mitarbeiternummer(uninteressant), Fußzeile mit Anzahl Mitarbeiter Produktion (interessant) und Anzahl Mitarbeiter Verwaltung (interessant). Die Liste ist Kostenstellenweise sortiert, d.h. so ein Aufbau für jede Kostenstelle. Mal auf einer A4 Seite wenns drauf geht, mal über 5 A4 Seiten, ist aber eh egal, mich interessieren ja eh nur die Fußzeilen (außer wenns Unstimmigkeiten gibt, dann eiere ich die ganze Liste durch).

    Sieht prinzipiell so aus:

    Bezeichnung1 Bezeichnung2 Bezeichnung 3
    ____________________________________
    Wert1 Wert2 Wert3
    ...
    ____________________________________
    Anzahl Mitarbeiter Produktion : XXX
    Anzahl Mitarbeiter Verwaltung: XXX

    Scanner hängt leider auch nicht an meinem Rechner, wenn das gehen würde käme er vielleicht hierher. Hab also nicht durchgehend die Möglichkeit das zu probieren, muß immer einen Kollegen erst vertreiben. :-) Werds aber heute noch probieren wie es in Word mit Sonderzeichen aussieht.
    Hab aber ab Montag Urlaub, vielleicht probier ich daheim mal weiter hab da den Hp 4400C, hat zumindest das gleiche Sacanprogramm.

    MFG
    Matthias
     
  6. ede

    ede Kbyte

    Registriert seit:
    18. April 2000
    Beiträge:
    296
    Hi Matthias,

    sind wir doch schon ein Stück weiter ;)
    Wie sehen denn die Listen aus die Du einscannst?
    Nur 1 Datenreihe?
    Oder wie ist das eingeteilt, so:
    Datenfeld1 Datenfeld2 Datenfeld3
    Zeile2-1 Zeile2-2 Zeile2-3
    .
    .
    .

    In Word mal alle Sonderzeichen anzeigen lassen, wie werden die Datenfelder getrennt.
    Wenn ein Aufbau wie in meinem Beispiel rauskommt, dann alles markieren und Leerzeichen mit Semikolon ersetzen.
    Wenn es Tabulatoren sind ist es eh schon gut.

    Also ein einigermaßen strukturiertes Ergebnis vom Scanner ist innerhalb weniger Sekunden in Word formatiert, da seh\' ich kein Problem.
    Aber...
    ...was wenn Dein OCR-Programm beim Einlesen Stuss produziert? DA mußt du garantiert nacharbeiten.

    HTH
    Ede
     
  7. DasExperiment

    DasExperiment Kbyte

    Registriert seit:
    3. Juni 2002
    Beiträge:
    330
    Hi Ede,

    ich meine mit Flatfile ein ASCII File, ob das nun auf CSV, CMA oder noch TXT lautet ist egal.
    Scanner ist der HP Scanjet 7400C. Scanprogramm ist HP Precision Scan 3.0 Pro. Soweit ich weiß keine extra OCR Software, am Scanner direkt ein Button OCR, es wird gescannt und ohne zu fragen an Word geschickt. Ist Word 97. Da kann ich nur als TXT speichern, hab zumindest nix anderes gefunden und da ist nix durch Kommata oder andere Trennzeichen separiert (es sei denn die Endung *.ans ist quasi identisch zu *.csv).
    Aber wenn Du schon sagst ich müßte ein CSV File nacheditieren hat sich das leider wohl schon erledigt. Wäre in meinem Fall mehr Arbeit als die Liste per Hand einzugeben.

    Aber erstmal vielen Dank für die Hilfe!

    MfG

    Matthias

    P.S. Schade, schade so ein Glaskugel wäre schon hilfreich! :-) :-)
    Im Ernst, hab ich einfach vergessen. Hoffe jetzt ist alles wichtige dabei.
     
  8. ede

    ede Kbyte

    Registriert seit:
    18. April 2000
    Beiträge:
    296
    Hi Matthias,

    ich gehe mal davon aus, daß Du mit Flatfile einen ASCII-File meinst, Werte CSV um die Felder zu trennen.

    Also normal kann doch jede OCR-Software das Ergebnis in *.TXT speichern.
    Zusaätzlich meist noch andere Formate wie Word und Konsorten.
    Dann kannst Du zumindest von Word aus als ASCII-Text speichern.

    Aber das CSV-Format wirst du dann auf jedenfall nacheditieren müssen.
    Je nachdem wie die Daten vorliegen Anzahl Felder und Spalten, ist die Arbeit größer oder kleiner und man muß sich überlegen ob es lohnt.

    Also Details sind auch erst möglich, wenn man weiß, in welchem Format speichert Dein OCR-Programm und welche Texter hast Du zur weiteren Formatierung zur Verfügung.

    Bißchen mehr Infos mußt Du schon rausrücken, hab meine Glaskugel nämlich nicht mit dabei ;)

    CU Ede
     
Status des Themas:
Es sind keine weiteren Antworten möglich.

Diese Seite empfehlen