Geschwindigkeit ist nicht alles. Haben Sie sie auf Konsistenz überprüft?
Ich habe nicht den gesamten hier aufgeführten Code getestet. Ich habe meinen eigenen Code (der zugegebenermaßen nicht vollständig konsistent war) und IndexOfSequence getestet. Ich stellte fest, dass IndexOfSequence für viele Tests viel schneller war als mein Code, aber bei wiederholten Tests stellte ich fest, dass es weniger konsistent war. Insbesondere scheint es am schwierigsten zu sein, Muster am Ende des Arrays zu finden, aber manchmal werden sie auch in der Mitte des Arrays übersehen.
Mein Testcode ist nicht auf Effizienz ausgelegt, ich wollte nur eine Reihe zufälliger Daten mit einigen bekannten Zeichenfolgen enthalten. Dieses Testmuster ähnelt in etwa einer Grenzmarkierung in einem Upload-Stream für http-Formulare. Das war es, wonach ich gesucht habe, als ich auf diesen Code gestoßen bin, also dachte ich mir, ich würde ihn mit den Daten testen, nach denen ich suchen werde. Je länger das Muster ist, desto häufiger verfehlt IndexOfSequence einen Wert.
private static void TestMethod()
{
Random rnd = new Random(DateTime.Now.Millisecond);
string Pattern = "-------------------------------65498495198498";
byte[] pattern = Encoding.ASCII.GetBytes(Pattern);
byte[] testBytes;
int count = 3;
for (int i = 0; i < 100; i++)
{
StringBuilder TestString = new StringBuilder(2500);
TestString.Append(Pattern);
byte[] buf = new byte[1000];
rnd.NextBytes(buf);
TestString.Append(Encoding.ASCII.GetString(buf));
TestString.Append(Pattern);
rnd.NextBytes(buf);
TestString.Append(Encoding.ASCII.GetString(buf));
TestString.Append(Pattern);
testBytes = Encoding.ASCII.GetBytes(TestString.ToString());
List<int> idx = IndexOfSequence(ref testBytes, pattern, 0);
if (idx.Count != count)
{
Console.Write("change from {0} to {1} on iteration {2}: ", count, idx.Count, i);
foreach (int ix in idx)
{
Console.Write("{0}, ", ix);
}
Console.WriteLine();
count = idx.Count;
}
}
Console.WriteLine("Press ENTER to exit");
Console.ReadLine();
}
(Offensichtlich habe ich IndexOfSequence von einer Erweiterung wieder in eine normale Methode für diesen Test konvertiert.)
Hier ist ein Beispiellauf meiner Ausgabe:
change from 3 to 2 on iteration 1: 0, 2090,
change from 2 to 3 on iteration 2: 0, 1045, 2090,
change from 3 to 2 on iteration 3: 0, 1045,
change from 2 to 3 on iteration 4: 0, 1045, 2090,
change from 3 to 2 on iteration 6: 0, 2090,
change from 2 to 3 on iteration 7: 0, 1045, 2090,
change from 3 to 2 on iteration 11: 0, 2090,
change from 2 to 3 on iteration 12: 0, 1045, 2090,
change from 3 to 2 on iteration 14: 0, 2090,
change from 2 to 3 on iteration 16: 0, 1045, 2090,
change from 3 to 2 on iteration 17: 0, 1045,
change from 2 to 3 on iteration 18: 0, 1045, 2090,
change from 3 to 1 on iteration 20: 0,
change from 1 to 3 on iteration 21: 0, 1045, 2090,
change from 3 to 2 on iteration 22: 0, 2090,
change from 2 to 3 on iteration 23: 0, 1045, 2090,
change from 3 to 2 on iteration 24: 0, 2090,
change from 2 to 3 on iteration 25: 0, 1045, 2090,
change from 3 to 2 on iteration 26: 0, 2090,
change from 2 to 3 on iteration 27: 0, 1045, 2090,
change from 3 to 2 on iteration 43: 0, 1045,
change from 2 to 3 on iteration 44: 0, 1045, 2090,
change from 3 to 2 on iteration 48: 0, 1045,
change from 2 to 3 on iteration 49: 0, 1045, 2090,
change from 3 to 2 on iteration 50: 0, 2090,
change from 2 to 3 on iteration 52: 0, 1045, 2090,
change from 3 to 2 on iteration 54: 0, 1045,
change from 2 to 3 on iteration 57: 0, 1045, 2090,
change from 3 to 2 on iteration 62: 0, 1045,
change from 2 to 3 on iteration 63: 0, 1045, 2090,
change from 3 to 2 on iteration 72: 0, 2090,
change from 2 to 3 on iteration 73: 0, 1045, 2090,
change from 3 to 2 on iteration 75: 0, 2090,
change from 2 to 3 on iteration 76: 0, 1045, 2090,
change from 3 to 2 on iteration 78: 0, 1045,
change from 2 to 3 on iteration 79: 0, 1045, 2090,
change from 3 to 2 on iteration 81: 0, 2090,
change from 2 to 3 on iteration 82: 0, 1045, 2090,
change from 3 to 2 on iteration 85: 0, 2090,
change from 2 to 3 on iteration 86: 0, 1045, 2090,
change from 3 to 2 on iteration 89: 0, 2090,
change from 2 to 3 on iteration 90: 0, 1045, 2090,
change from 3 to 2 on iteration 91: 0, 2090,
change from 2 to 1 on iteration 92: 0,
change from 1 to 3 on iteration 93: 0, 1045, 2090,
change from 3 to 1 on iteration 99: 0,
Ich möchte mich nicht für IndexOfSequence entscheiden, es war einfach das, mit dem ich heute angefangen habe zu arbeiten. Am Ende des Tages bemerkte ich, dass Muster in den Daten fehlten, also schrieb ich heute Abend meinen eigenen Mustervergleicher. Es ist allerdings nicht so schnell. Ich werde es ein bisschen weiter optimieren, um zu sehen, ob ich es 100% konsistent machen kann, bevor ich es poste.
Ich wollte nur alle daran erinnern, dass sie solche Dinge testen sollten, um sicherzustellen, dass sie gute, wiederholbare Ergebnisse liefern, bevor Sie ihnen im Produktionscode vertrauen.