Ich muss Tausende von Textausschnitten aus PDFs in eine Tabellenkalkulation übertragen. Sie sind kurz, selten mehr als 2-3 Zeilen, aber jeder Zeilenumbruch erzeugt eine neue Zelle, und ich muss diese manuell reparieren, was viel Zeit kostet.
Weil ich so viele davon habe, ist es mir einfach zu zeitaufwändig, die Problemumgehung "Einfügen in Word und Suchen und Ersetzen" zu verwenden. Gibt es eine Möglichkeit, den Zeilenumbruch beim Kopieren verschwinden zu lassen? Vielleicht gibt es einen Viewer, der dafür einen speziellen Kopiermodus anbietet, oder ein Plugin?
Die Dokumente sind wissenschaftliche Artikel. Die Textanordnung ist ziemlich linear. Sie können davon ausgehen, dass sich der von mir kopierte Text nicht in einer Tabelle oder einem Gleitkomma befindet und nicht gedreht wurde. (Wenn so etwas passiert, denke ich, dass ich es manuell erledigen werde). Der Text wird häufig in zwei Spalten gesetzt, aber ich habe keine Probleme, nur den Text zu markieren, den ich aus seiner Spalte benötige. Ich muss keine spezielle Formatierung beibehalten. Ich bin bereit, eine Lösung auszuprobieren, die zum Beispiel alle nicht druckbaren Zeichen entfernt. Die Texte sind in englischer Sprache, es ist in Ordnung, wenn die Lösung nur in ASCII funktioniert / alle nicht-alphanumerischen ASCII-Zeichen des kopierten Textes entfernt.
Ich bevorzuge eine Lösung, die unter Linux funktioniert, möglicherweise eine Art Okular-Plugin. Aber wenn es eine reine Windows-Lösung gibt, möchte ich auch davon erfahren. Ich habe eine Lizenz für ein etwas neues Acrobat Pro auf dem Windows-Rechner.