Entwickler-Ecke :: Thema anzeigen - StreamReader array index out of range nach ca 6,7 Mio Zeilen

elchgesicht - Di 28.09.10 20:04
Titel: StreamReader array index out of range nach ca 6,7 Mio Zeilen

Hallo zusammen,
erst mal als Basisinfo: ich bin neu unterwegs mit c#, programmiere aber seit Jahren in diversen anderen Sprachen. Nun hab ich folgendes Problem: ich muss ein sehr großes Logfile parsen, ca 12 Mio Zeilen.
Nun verwende ich die Klasse StreamReader. Bei kleinen Testdateien läuft alles super. Bei den großen realen Exemplaren ist allerdings nach ca 6,7 Mio Zeilen Schluss.
Fehler: Array Index out of range.
Das Problem ist, es muss ein klasseninterner Index sein, der da voll läuft, da ich selber keinen Index oder ein Array verwende.

Frage: Kennt jemand das Problem?
Frage: Gibt es eine einfache Möglichkeit, eine Datei wirklich Zeilenweise zu lesen, ohne dass ein Puffer (außer einer meiner Wahl) beschrieben wird. ?
Ich bin dankbar für alle Tipps.

C#-Quelltext

1:
2:
3:
4:
5:
6:
7:
8:
9:
10:
11:
12:
13:
14:
15:
16:
17:
18:
19:
20:
21:
22:
23:
24:
25:
26:
27:
28:

  private void readFile()
            {
                string line = "";
                    if ((char)this.stream.Peek()=='T')
                    {
                        this.stream.ReadLine();
                    }

                    uint linecounter=0;
                    while((line = this.stream.ReadLine())!=null)
                    {
                        linecounter++;

//das ist ein Versuch das Problem zu umgehen, aber es hilft nichts
                        if (linecounter %100000 == 0)
                        {
                            this.stream.DiscardBufferedData();
                            Console.WriteLine(linecounter);
                        }
                        if (!(line.StartsWith("\t")) && (Char.IsDigit(line[0])))
                        {

                            this.data.numberofcalls++;
                        }
                    }
                    this.stream.Dispose();
                    this.stream.Close();
              }

Yogu - Do 30.09.10 20:17

elchgesicht hat folgendes geschrieben :

C#-Quelltext

 
20:
21:

/* ... */
if (!(line.StartsWith("\t")) && (Char.IsDigit(line[0])))
    /* ... */

Bist du dir sicher, dass in jeder Zeile mindestens ein Zeichen steht? Andernfalls würde der Zugriff auf das erste Zeichen eine Exception werfen.

Außerdem denke ich, dass die linke Bedingung sinnlos ist, denn wenn das erste Zeichen eine Ziffer ist, kann es kein Tabulator sein...

elchgesicht - Do 30.09.10 21:06

Diese Zeile war noch Teil der "Lesestudie" und wird definitiv noch geändert. Gestern habe ich mit einem anderen Tool (das neue soll dieses ersetzen, leider) eine Datei parsen müssen mit 21 GB Größe. Da werde ich noch jede Nanosekunde raus holen müssen, sonst dauert das geparse später mal ewig.
Das Ganze wird auch noch eine nette "Performancestudie" für .NET. Mal sehen was raus kommt.
Trotzdem danke für den Hinweis.

Entwickler-Ecke.de based on phpBB
Copyright 2002 - 2011 by Tino Teuber, Copyright 2011 - 2026 by Christian Stelzmann Alle Rechte vorbehalten.
Alle Beiträge stammen von dritten Personen und dürfen geltendes Recht nicht verletzen.
Entwickler-Ecke und die zugehörigen Webseiten distanzieren sich ausdrücklich von Fremdinhalten jeglicher Art!