CSV-Filteroptionen

Der CSV-Filter akzeptiert eine Optionszeichenfolge mit fĂĽnf bis fĂĽnfzehn durch Kommata getrennten Token. Die Token 6 bis 15 sind optional.

Beispiel:

Import aus UTF-8, Sprache Deutsch, Kommagetrennt, Texttrennzeichen ", AngefĂĽhrtes Feld als Text. CSV-Datei hat Spalten, die als Datum, Zahl, Zahl, Zahl formatiert sind:

soffice --infilter="Text - txt - csv (StarCalc):44,34,76,1,1/5/2/1/3/1/4/1,1031,true,true" test.csv

Export nach Windows-1252, Feldtrennzeichen: Komma, Texttrennzeichen: AnfĂĽhrungszeichen, Zelleninhalt wie gezeigt speichern:

soffice --convert-to "csv:Text - txt - csv (StarCalc):44,34,ANSI,1,,0,false,true,true" --outdir=/home/user test.ods

Token-Position

Definition

Bedeutung und Beispiel von Token

1

Feldtrennzeichen

Feldtrennzeichen als ASCII-Werte. Mehrere Werte werden durch den Schrägstrich ("/") getrennt, das heißt, wenn die Werte durch Semikola und horizontale Tabulatoren getrennt sind, wäre der Token 59/9. Um mehrere aufeinanderfolgende Trennzeichen als eines zu behandeln, hängen Sie "/MRG" an den Token an. Wenn die Datei Felder mit fester Breite enthält, verwenden Sie „FIX“. Beispiel: 44 (,)

2

Texttrennzeichen

Das Texttrennzeichen als ASCII-Wert, beispielsweise 34 fĂĽr doppelte AnfĂĽhrungszeichen und 39 fĂĽr einfache AnfĂĽhrungszeichen. Beispiel: 34 (").

3

Zeichensatz

Der in der Datei verwendete Zeichensatzcode, wie in der folgenden Tabelle beschrieben. Beispiel: 0 (System).

4

Zeilennummer, ab der gelesen werden soll.

CSV-Import

N: Zeilennummer, ab der gelesen werden soll. Beispiel: 3 (ab dritter Zeile beginnen).

5

Zellformatcodes fĂĽr jede Spalte

CSV-Import

Eine Folge von Spalten-/Formatierungscodes, wobei der Formatierungscode in der folgenden Tabelle angegeben ist. Beispielsweise: "1/5/2/1/3/1/4/1".

Wenn Werttrennzeichen verwendet werden, ist die Form dieses Tokens Spalte/Format[/Spalte/Format/…], wobei Spalte die Nummer der Spalte ist, mit 1 der Spalte ganz links. Der Formatcode ist unten aufgeführt.

Wenn der erste Token "FIX" ist, hat es die Form start/format[/start/format/…], wobei "start" die Nummer des ersten Zeichens für dieses Feld ist, mit 0 dem Zeichen ganz links in einer Zeile. Das Format wird unten erklärt.

6

Sprachkennung

Zeichenfolge in Dezimalschreibweise. Dieser Token entspricht dem Listenfeld "Sprache" in der Benutzeroberfläche für den CSV-Import. Wenn der Wert 0 ist oder weggelassen wird, wird die Sprachkennung der Benutzeroberfläche verwendet. Die Sprachkennung basiert auf den Microsoft-Sprachkennungen.

7

Felder in Hochkommata als Text formatieren

Zeichenfolge, entweder false oder true. Standardwert: false. Dieser Token ist das Äquivalent zum Markierfeld „Werte in Hochkommata als Text formatieren“.

8

Erweiterte Zahlerkennung

Import: Zeichenfolge, entweder false oder true. Standardwert: false. Dieser Token ist das Äquivalent zum Markierfeld „Erweiterte Zahlerkennung“.

Export: Zeichenfolge, entweder false oder true. Standardwert: true. Dieses Token hat kein UI-Ă„quivalent. Wenn true, werden die Zahlenzellen als Zahlen gespeichert. Bei false werden die Zahlen als Text mit Texttrennzeichen gespeichert.

9

Zellinhalt wie angezeigt speichern

CSV-Export

Zeichenfolge, entweder false oder true. Standardwert:true. Dieser Token ist das Ă„quivalent zum Markierfeld "Zelleninhalte wie angezeigt speichern".

10

Zellformeln exportieren

CSV-Export

Zeichenfolge, entweder false oder true. Standardwert: false. Exportiert Zellformeln.

11

Leerzeichen entfernen

CSV-Import

Zeichenfolge, entweder false oder true. Standardwert: false. Entfernt Leerzeichen. FĂĽhrende und abschlieĂźende Leerzeichen werden beim Lesen der Datei abgeschnitten.

12

Tabellen exportieren

CSV-Export

Exportiert das gesamte Dokument mit einer CSV-Datei je Tabelle oder eine bestimmte Tabelle.

  • 0 oder nicht vorhanden: bedeutet das Standardverhalten, erste Tabelle von der Befehlszeile oder aktuelle Tabelle in den Makrofilteroptionen, exportiert nach sample.csv

  • -1: fĂĽr alle Tabellen, jede Tabelle wird in eine einzelne Datei mit dem Basisdateinamen verkettet mit dem Tabellennamen exportiert, beispielsweise sample-Tabelle1.csv, sample-Tabelle2.csv und sample-Tabelle3.csv

  • N: exportiert die N-te Tabelle innerhalb des Bereichs der Tabellenzahl. Um beispielsweise die zweite Tabelle zu exportieren, geben Sie 2 ein, um sample-Tabelle2.csv zu erhalten

13

Als Formeln importieren

CSV-Import

Zeichenfolge, entweder false oder true. Standardwert: false. Legt fest, ob FormelausdrĂĽcke, die mit einem Gleichheitszeichen "=" beginnen, als Formeln ausgewertet oder als Textdaten importiert werden sollen. Wenn true werden Formeln bei der Eingabe auswerten. Bei false werden Formeln als Text ĂĽbernommen. Wenn weggelassen (ĂĽberhaupt nicht vorhanden), ist der Standardwert true, um das Verhalten der Optionszeichenfolge alter Versionen beizubehalten, die diesen Token ĂĽberhaupt nicht hatten. Wenn vorhanden und leer (oder ein anderer Wert als true), ist der Standardwert false.

14

Eine Byte-Reihenfolge-Markierung (englisch: byte-order-mark – BOM) einfügen.

Zeichenfolge, entweder false oder true. Standardwert: false. Wenn true, wird eine Byte-Reihenfolge-Markierung ( englisch: Byte-Order-Mark – BOM) in den Export einbezogen. Bei false enthält der Export keine Stückliste. Wenn weggelassen (überhaupt nicht vorhanden), ist der Standardwert false, um das Verhalten der Optionszeichenfolge alter Versionen beizubehalten, die dieses Token überhaupt nicht hatten. Wenn vorhanden und leer (oder ein anderer Wert als true), ist der Standardwert false. Wird beim Import automatisch erkannt.

15

Zahlen in wissenschaftlicher Schreibweise erkennen

Zeichenfolge, entweder false oder true. Standardwert: true. Wenn true, wird ermittelt, ob ein Zellinhalt, der ein „E“ oder „e“ enthält, eine Zahl in wissenschaftlicher Schreibweise ist. Wenn false, wird nicht versucht, Zahlen in wissenschaftlicher Schreibweise zu erkennen. Token kann nur dann false sein, wenn Token 8 (Sonderzahlen erkennen) false ist. Wenn er weggelassen wird, ist der Standardwert true, um das Verhalten der Optionszeichenfolge alter Versionen beizubehalten, die dieses Token überhaupt nicht hatten.


Sonderfall von CSV-Dateien mit in der ersten Zeile definiertem Trennzeichen

CSV-Import und -Export unterstĂĽtzen eine sep=- und "sep="-Feldtrennzeicheneinstellung. Beim Lesen eines CSV-Dokuments wird das Trennzeichen aus dem initialen sep= bzw. "sep=" Einzelfeld genommen, wenn dies der einzige Zeileninhalt ist.

Beim Lesen einer CSV-Datei bleibt die in AnfĂĽhrungszeichen gesetzte Form als (nicht in AnfĂĽhrungszeichen gesetzter) Zellinhalt erhalten. Sie sehen sep=| wenn | das Trennzeichen in der ersten Zeile ist. In der Form ohne AnfĂĽhrungszeichen wird das Trennzeichen verworfen, da es sich im Kontext um ein echtes Feldtrennzeichen handelt. In der ersten Zeile sehen Sie sep=.

Beim Schreiben einer CSV-Datei wird der Inhalt der vorhandenen einzelnen Zelle oben links wie sep=| an das aktuelle Trennzeichen mit der AnfĂĽhrungszeichenform von "sep=|" angepasst (falls AnfĂĽhrungszeichen / Texttrennzeichen nicht leer gesetzt werden und | das Trennzeichen ist) und immer das doppelte ASCII-AnfĂĽhrungszeichen " verwendet.

Wenn die Zeile mit sep=| nicht als Daten importiert werden soll, denken Sie daran, die Nummer Ab Zeile im Dialog auf 2 zu setzen. Beachten Sie, dass diese Zeile nicht importiert wird beim erneuten Speichern erhalten bleibt.

Beispiel:


        sep=|
        "BUCHSTABE"|"TIER"
        "A"|"Affe"
        "B"|"Bär"
        "C"|"Chamäleon"
    

Formatierungscodes fĂĽr Token 5

Bedeutung

Code

Standard

1

Text

2

MM/TT/JJ

3

TT/MM/JJ

4

JJ/MM/TT

5

-

6

-

7

-

8

Feld ignorieren (nicht importieren)

9

US-Englisch

10


Zeichensatzcodes fĂĽr Token 3

Zeichensatz

Index

Unbekannt

0

Windows-1252/WinLatin 1 (Western)

1

Apple Macintosh (Western)

2

DOS/OS2-437/US (Western)

3

DOS/OS2-850/International (Western)

4

DOS/OS2-860/Portugiesisch (Western)

5

DOS/OS2-861/Isländisch (Western)

6

DOS/OS2-863/Kanadisch-französisch (Western)

7

DOS/OS2-865/Nordisch (Western)

8

Systemstandard

9

Symbol

10

ASCII/US (Western)

11

ISO-8859-1 (Western)

12

ISO-8859-2 (Mitteleuropäisch)

13

ISO-8859-3 (Latin 3)

14

ISO-8859-4 (Baltisch)

15

ISO-8859-5 (Kyrillisch)

16

ISO-8859-6 (Arabisch)

17

ISO-8859-7 (Griechisch)

18

ISO-8859-8 (Hebräisch)

19

ISO-8859-9 (TĂĽrkisch)

20

ISO-8859-14 (Western)

21

ISO-8859-15/EURO (Western)

22

DOS/OS2-737 (Griechisch)

23

DOS/OS2-775 (Baltisch)

24

DOS/OS2-852 (Mitteleuropäisch)

25

DOS/OS2-855 (Kyrillisch)

26

DOS/OS2-857 (TĂĽrkisch)

27

DOS/OS2-862 (Hebräisch)

28

DOS/OS2-864 (Arabisch)

29

DOS/OS2-866/Russisch (Kyrillisch)

30

DOS/OS2-869/Modern (Griechisch)

31

DOS/Windows-874 (Thailändisch)

32

Windows-1250/WinLatin 2 (Mitteleuropäisch)

33

Windows-1251 (Kyrillisch)

34

Windows-1253 (Griechisch)

35

Windows-1254 (TĂĽrkisch)

36

Windows-1255 (Hebräisch)

37

Windows-1256 (Arabisch)

38

Windows-1257 (Baltisch)

39

Windows-1258 (Vietnamesisch)

40

Apple Macintosh (Arabisch)

41

Apple Macintosh (Mitteleuropäisch)

42

Apple Macintosh/Kroatisch (Mitteleuropäisch)

43

Apple Macintosh (Kyrillisch)

44

Nicht unterstĂĽtzt: Apple Macintosh (Devanagari)

45

Nicht unterstĂĽtzt: Apple Macintosh (Farsi)

46

Apple Macintosh (Griechisch)

47

Nicht unterstĂĽtzt: Apple Macintosh (Gujarati)

48

Nicht unterstĂĽtzt: Apple Macintosh (Gurmukhi)

49

Apple Macintosh (Hebräisch)

50

Apple Macintosh/Isländisch (Western)

51

Apple Macintosh/Rumänisch (Mitteleuropäisch)

52

Apple Macintosh (Thailändisch)

53

Apple Macintosh (TĂĽrkisch)

54

Apple Macintosh/Ukrainisch (Kyrillisch)

55

Apple Macintosh (vereinfachtes Chinesisch)

56

Apple Macintosh (traditionelles Chinesisch)

57

Apple Macintosh (Japanisch)

58

Apple Macintosh (Koreanisch)

59

Windows-932 (Japanisch)

60

Windows-936 (vereinfachtes Chinesisch)

61

Windows-Wansung-949 (Koreanisch)

62

Windows-950 (traditionelles Chinesisch)

63

Shift-JIS (Japanisch)

64

GB-2312 (vereinfachtes Chinesisch)

65

GBT-12345 (traditionelles Chinesisch)

66

GBK/GB-2312-80 (vereinfachtes Chinesisch)

67

BIG5 (traditionelles Chinesisch)

68

EUC-JP (Japanisch)

69

EUC-CN (vereinfachtes Chinesisch)

70

EUC-TW (traditionelles Chinesisch)

71

ISO-2022-JP (Japanisch)

72

ISO-2022-CN (vereinfachtes Chinesisch)

73

KOI8-R (Kyrillisch)

74

Unicode (UTF-7)

75

Unicode (UTF-8)

76

ISO-8859-10 (Mitteleuropäisch)

77

ISO-8859-13 (Mitteleuropäisch)

78

EUC-KR (Koreanisch)

79

ISO-2022-KR (Koreanisch)

80

JIS 0201 (Japanisch)

81

JIS 0208 (Japanisch)

82

JIS 0212 (Japanisch)

83

Windows-Johab-1361 (Koreanisch)

84

GB-18030 (vereinfachtes Chinesisch)

85

BIG5-HKSCS (traditionelles Chinesisch)

86

TIS 620 (Thailändisch)

87

KOI8-U (Kyrillisch)

88

ISCII Devanagari (Indisch)

89

Unicode (Javas modifiziertes UTF-8)

90

Adobe Standard

91

Adobe Symbol

92

PT 154 (In ParaType entwickelte kyrillische asiatische Windows-Codepage)

93

Unicode UCS-4

65534

Unicode UCS-2

65535


Bitte unterstĂĽtzen Sie uns!