Wenn Sie fehlerhaften Text zusammenführen möchten, während Formatierung, Platzierung, Absätze und andere Typografie des vorhandenen Textes so weit wie möglich erhalten bleiben , anstatt ihn als einfachen Text in einen neu erstellten Textbereich einzufügen , können Sie John Wundes 'ausprobieren. erstaunliches Join Text Frames- Skript .
Es macht genau das, was es verspricht: Es verschmilzt Textausschnitte zu einem Textausschnitt, indem es intelligente Urteile basierend darauf trifft, wo sie relativ zueinander sind:
- Es führt benachbarte Textausschnitte (z. B. aus unterbrochenen Textzeilen aus PDFs) zu einzelnen Zeilen zusammen, wobei eine gewisse Kontrolle darüber geboten wird, wie nahe dieselbe Zeile betrachtet wird.
- Es führt separate Textzeilen zu einem mehrzeiligen Textobjekt zusammen, wobei der Text in der richtigen Reihenfolge (von oben nach unten) angezeigt wird, wodurch fehlerhafte Absätze behoben werden.
- Es besteht dann die Möglichkeit, die ursprüngliche Formatierung des gesamten zusammengeführten Textes wiederherzustellen. Dies kann eine Weile dauern, aber es gibt Ihnen ziemlich genaue Schätzungen darüber, wie lange es dauern wird, und die Option zu überspringen, wenn es sich nicht lohnt.
Es ist sehr gut!
Beachten Sie, dass es nur mit Punkttext funktioniert, nicht mit Flächentext (gut hier, da PDFs fast immer Punkttext sind). Wenn Sie aus irgendeinem Grund versuchen, Flächentext zusammenzuführen, können Sie ihn mit dem Kelso Cartography-Skript "Punkttext erstellen" konvertieren
Es ist auch praktisch , in Verbindung mit AjarProductions' Convert to Text Area Skript (Kelso Kartographie auch ein ähnliches Skript, siehe Link oben), wenn Sie in in die richtige Textbereiche mit Auto-fließenden Abschnitten defektem Text wieder aktivieren möchten:
- Wählen Sie die fehlerhaften Textausschnitte aus und führen Sie das Skript Textrahmen verbinden aus
- Kopieren Sie den Text und fügen Sie ihn in einen Texteditor ein, mit dem Sie Absatzzeichen finden / ersetzen können (z. B. InDesign, der Nur-Text-Editor eines Codierers oder vielleicht sogar etwas wie ( Flüstern ) Word ...).
Suchen / ersetzen Sie das unerwünschte Ende von Zeilenumbrüchen. Wenn es viele separate Absätze gibt, die Sie beibehalten möchten, 1) sind Sie sicher, dass Sie mit InDesign nicht besser dran wären? 2) Sie könnten es so machen:
- Suchen / Ersetzen zwei aufeinander folgende Absatzmarken mit einem Text - Platzhalter, die nirgendwo sonst im Text erscheint (zB
\|\C.L.O.W.N.H.O.R.R.O.R/|/
)
- Suchen / Ersetzen von Absatzmarkierungen durch nichts oder Leerzeichen: Verwandeln Sie sie in eine lange Textzeile mit gelegentlichen Bursts von
\|\C.L.O.W.N.H.O.R.R.O.R/|/
- Suchen / Ersetzen
\|\C.L.O.W.N.H.O.R.R.O.R/|/
für ein neues Absatzzeichen - das einen Absatz dort platziert, wo zwei vorher waren.
Kopieren Sie den Text wieder hinein und führen Sie das Skript In Textbereich konvertieren aus. Es ist jetzt ein fließender Textbereich mit Absatzumbrüchen an den richtigen Stellen.
Leider kann nichts den umrissenen Text reparieren, außer zu verhindern, dass er umrissen wird, ihn erneut einzugeben oder potenziell zwielichtiger OCR-Software zu vertrauen.