Fehlerquellen bei DCC

DCC-Übertragung, Fehlerbetrachtung

Inhalt

1. Einleitung

2. Fehlerquellen

3. Empfangstechniken

4. Absicherung durch Prüfcodes

5. Praktische Versuche / Messungen

6. 6. 'Offizielle' Tests

7. Zusammenfassung

1. Einleitung

RCN128, DCC-A

^-18

2. Fehlerquellen

Stromunterbrechungen
Das ist in der Regel bedingt durch Probleme im Rad-Schiene-Kontakt oder durch Umschaltvorgänge (z.B. bei einer Kehrschleife). Stromunterbrechungen führen bei sehr kurzen Zeitdauern zu Verlängerungen der jeweiligen Bitphase (Pegel bleibt einfach erhalten), bei längeren Unterbrechungen zu einem Absinken der Spannung am Dekoder und zu einem Abbruch/Restart des DCC-Empfangs.

Die Zeitdauer von Stromunterbrechungen ist schwer abschätzbar, aber zwei mögliche Quellen seien hier mal betrachtet:
- Rad-Schiene-Kontakt:
  Angenommen, eine Rad fährt über ein Haar auf dem Gleis. Das Rad wird abheben und nach dem Haar wieder aufsetzen. Wie lang dauert dieser Vorgang?
  Hierzu eine einfache Beispielrechnung: Annahmen: Das Fahrzeug fährt 0,3m/s (=100km/h, 1:87). Raddurchmesser 11mm (Radumfang: 34.6mm), ein Haar mit 0.1mm Durchmesser auf der Schiene.
  Die Winkelgeschwindigkeit des Rades ergibt sich zu: 300mm/34.6mm = 8,7 U/s; skaliert mit 360° ergibt 3120°/s.
  Das Rad hebt ab, wenn cos(phi) = 5.4/5.5 ist. Damit berechnet sich phi = arccos(5.4/5.5) = 11°; d.h. das Rad ist für 22° in der Luft.
  Mit obiger Winkelgeschwindigkeit ergibt sich damit ein Drop von 7.05ms.
  Natürlich ist nicht nur ein Rad an der Stromübertragung beteiligt, aber die möglichen Unterbrechungen dürften sich durchaus in den ms-Bereich erstrecken.
- Umschaltvorgänge:
  Übliche Relais haben Schaltdauern (break bis make) von ca. 400us bis etwa 1ms. (diese Daten stammen aus einer Testreihe an einem Kehrschleifenmodul.)
Kurzschlüsse
Diese sind bedingt z.B. durch Berühren von Herzstücken oder Entgleisungen. Dabei dürften Radwinkel im Bereich von 5° bis 15° beteiligt sein. Analog zur obigen Betrachtung ergeben sich damit Drops im Bereich von 1ms bis 3ms.
systematische Fehler, korreliert
Diese konnen entstehen z.B. durch unsaubere Boosterflanken. Allerdings dürften systematische Fehler zu einer derart hohen Bitfehlerrate führen, dass ein Betrieb kaum möglich ist und sich eine Fehlerbetrachtung erübrigt.
systematische Fehler, nicht korreliert Das können z.B. Störung durch andere Dekoder sein, deren Motorendstufe jeweils den Pegel am Gleis zusammenbrechen lassen. Die Folge sind sehr kurze (im Bereich weniger µs liegend) Spannungseinbrüche am Gleis.

3. Empfangstechniken

Flankentriggerung:
Hier wird eine Flanke (als Interrupt) benutzt, um zusammen mit einem Zeitglied die Bitentscheidung zu treffen. Dieses Verfahren ist extrem anfällig für Störungen und nur bei stationären Dekoder verwendbar.
Flankenauswertung:
Hier wird eine Flanke (oder werden beide Flanken) vermessen und daraus die Bitentscheidung getroffen. Das Verfahren sortiert sehr gut die obigen Fehler aus, weil durch die Fehler entweder ein Bit unzulässig verlängert oder verkürzt wird. Bei Auswertung beider Flanken wird zudem auch die 'schiefe' Rückkehr des Algorithmus auf eine korrekt Folge aus Halbbits erkannt.
Abtastung:
Hier wird das Signal abgetastet, je nach Auflösung des Abtasters werden Störungen erkannt und eine DCC_Nachricht verworfen. Agiert der Abtaster in recht groben Raster, wird er zunehmend empfänglicher für Störungen. Auch bei Abtastung gibt es dann noch den Unterschied der einfach oder doppelten Flankenauswertung. Im Grenzfall sehr feiner Abtastauflösung ist die Abtastung ident zur Flankenauswertung.

4. Absicherung durch Prüfcodes

Ausgangssituation

Theoretische Überlegungen

XOR liefert dann ein false-positive, wenn zwei Bits zugleich kippen. Betrachtet man das mal für 6 Bytes, haben wir 48 Bits. Weiters nehme ich mal p für die Bitfehlerwahrscheinlichkeit an. Die Wahrscheinlichkeit für einen Doppelfehler ist dann (x aus y ist der Binomialkoeffizient):

(1-p)⁴⁶ * p² * (2 aus 48)

wobei sich (2 aus 48) zu 48 * 47 / 2 = 1128 ergibt. Das gilt für bitweises, serielles XOR. Macht man ein byteweises XOR, kommt dieses false-positive nur zustande, wenn jeweils die gleiche Bitposition im Byte betroffen ist. D.h. statt 47 möglichen Partnerbits zu einem Einzelfehler gibt es dann nur noch 5. Die Chance für eine false-positive verringert sich dadurch mit dem Faktor 5/47.

Wie skaliert das mit der Bitzahl: (1-p)^Bitzahl könnte man für kleine p in eine Reihe entwickeln, der erste Anteil ist linear: p*Bitzahl. Für sehr kleine p könnte man das auch noch vernachlässigen und würde p^2 * (2 aus Bitzahl) als dominanten Einfluß haben. D.h. die Versagenshäufigkeit eines XOR geht quadratisch mit der Bitzahl hoch, bei byteweisem XOR dann noch skaliert mit (B/8-1)/(B-1).
Zum Vergleich eine (theoretisch optimal angenommene) CRC. Hier wird der Bitfehler statisch perfekt auf die n-Prüfbits verschmiert. Die Chance für zwei identische 'Verschmiermuster' ist dann 1/(2^crc_length), bei einer 8-Bit CRC also 1/256. D.h. statt 5/48 habe ich 1/256 als Gewinn. (Das aber nur, wenn das 'Verschmieren' bereits voll greift, d.h. wenn die CRC dann schon eine nennenswerte Zahl an shift + divide gemacht hat. Das trifft bei kurzen Sequencen aber oft nicht zu).

Implementierung

XOR ist auf allen gängigen System verfügbar. Als Dekoder werden häufig 8-bit Prozessoren eingesetzt, das Vorhandensein von Hardwaresupport für eine CRC Berechnung ist dort allgemein nicht anzunehmen. Erst mit neueren ARM-Generationen (Cortex M3, M33) kommt Hardware-CRC in die Zielplattformen.
CRC läßt sich bitweise oder tabellengestützt wortweise berechnen. Eine sehr laufzeitoptimale Lösung geht über XOR und Tabellenzugriff, erfordert aber auch eine Tabelle der Länge 2ⁿ im Speicher.
Das Timing ist durchaus kritisch, weil der Dekoder zuerst entscheiden muß, ob eine Nachricht korrekt empfangen wurde und dann in sehr kurzem Zeitabstand die entsprechende Quittung via Railcom senden muß. Railcomantworten werden daher oft vorberechnet und nur noch bei Prüfsumme=ok freigegeben. Die Prüfsummenberechnung muß daher bereits in der Empfangsroutine möglich sein.

Literatur

The Effectiveness of Checksums for Embedded Networks

Cyclic Redundancy Code (CRC) Polynomial Selection For Embedded Networks

_-10

5. Praktische Versuche / Messungen

Testreihe bei Döhler und Haass

Döhler und Haass

Ergebnisse:

Fehlerquelle 1: Die meisten Fehler waren sogenannte "Taktpausenfehler".
(Zur Erläuterung: D&H kann auch SX; bei SX werden die Bits am Gleis jeweils durch eine sogenannte "Taktpause" (= kurzes "Cutout" mit 10µs Länge) getrennt. Diese darf nicht länger als 15µs werden, sonst wird der Empfang abgebrochen. Umgekehrt muss für SX zwischen jedem Bit eine Taktpause existieren.
Für DCC ist solch eine Prüfung eigentlich "unnötig", aber da wir nur einen Code zur Datengewinnung haben, lesen wir natürlich auch DCC mit der für SX erforderlichen Genauigkeit ein. )
Fehlerquelle 2: Danach kamen Timingfehler in der ersten Bithälfte des DCC-Signals. Also weder eine "1" (um die 58µs) noch eine "0" (ab 100µs) erkannt.
Fehlerquelle 3: Anschließend kamen "Missmatch"-Fehler. Das bedeutet: die erste Bithälfte wurde als "halbe 1", die zweite Bithälfte wurde als "halbe 0" erkannt (oder umgekehrt).

Testreihe bei Tams Elektronik

Tams Elektronik

1. DCC-Auswertung mit beidseitiger Flankenauswertung, XOR-Prüfung aktiviert. (Regelbetrieb des Dekoders)
2. DCC-Auswertung mit beidseitiger Flankenauswertung, XOR-Prüfung deaktiviert.
3. DCC-Auswertung mit einseitiger Flankenauswertung, XOR-Prüfung aktiviert.
4. DCC-Auswertung mit einseitiger Flankenauswertung, XOR-Prüfung deaktiviert.

Ergebnisse:

Fall 1. (beide Flanken + XOR): Bis runter zu einer Empfangsgüte von 10% war eine Lok noch akzeptabel manuell kontrollierbar.
Fall 2. Kein Unterschied zu Fall 1. Die DCC-Nachrichten wurde jeweils bereits vor der XOR-Auswertung verworfen.
Fall 3. Unterhalb von Empfangsgüten von 25% kam es zu sporadischen Fehlfunktionen, Nachrichten wurden trotz XOR an die Auswertung weitergereicht.
Fall 4. Kaum vernünftiger Betrieb möglich.

OpenDCC

DCC-Übertragung, Fehlerbetrachtung

Inhalt

1. Einleitung

2. Fehlerquellen

3. Empfangstechniken

4. Absicherung durch Prüfcodes

Ausgangssituation

Theoretische Überlegungen

Implementierung

Literatur

5. Praktische Versuche / Messungen

6. 'Offizielle' Tests

7. Zusammenfassung