Die Technologie Highlights der H.264 IP -Kamera

2022 09/02

1, Das hierarchische Design des H.264 -IP -Kamera -Algorithmus kann konzeptionell in zwei Ebenen unterteilt werden: Videocodierungsschicht (VCL: Video -Codierungsschicht) für einen effizienten Videoinhalt verantwortlich, so die Netzwerkabstraktionsschicht (NAL: Netzwerkabstraktionsschicht) ist verantwortlich für die Netzwerkanforderungen für die geeignete Art und Weise, Daten zu verpacken und zu übertragen. Zwischen VCL und NAL definiert die Schnittstelle eine paketbasierte Methoden, Verpackungen und die entsprechende NAL-Signalübertragung. Somit ist eine hohe Codierungseffizienz und netzwerkfreundliche Aufgabe von VCL und NAL abgeschlossen. VCL-Schicht einschließlich blockbasierter Bewegungskompensationshybrid-Codierung und einigen neuen Funktionen. Und wie der vorherige Videocodierungsstandard ist H.264 nicht die im Entwurf enthaltenen Funktionen vor der Behandlung und Nachbearbeitung, die die Flexibilität des Standards erhöhen kann. NAL ist verantwortlich für das Netzwerksegment, das das zugrunde liegende Format verwendet, um Daten zu verkörpern, einschließlich Rahmen, logischer Kanalsignalisierung, Timing oder Sequenz der Endverwendung der Informationssignale. Zum Beispiel unterstützt NAL im Übertragungsformat den Schaltungsschalt-Videokanal und unterstützt Video im Internet mithilfe von RTP / UDP / IP-Übertragungsformat. NAL -Headerinformationen, einschließlich ihrer eigenen, Segmentstrukturinformationen und die tatsächlichen Lastinformationen, die die Oberseite der VCL -Daten haben. (Wenn Sie Datenpartitionierung verwenden, können Daten aus mehreren Komponenten bestehen).

2, hohe Präzisions-, Multi-Mode-Bewegungsschätzung

H.264 Unterstützung 1/4 oder 1/8 Pixel -Präzisionsbewegungsvektor. 1 /4 Pixel-Präzisions-6-Tap-Filter kann verwendet werden, um Hochfrequenzrauschen zu reduzieren. Für 1 /8-Pixel-Präzisionsbewegungsvektor kann ein komplexerer 8-Tap-Filter verwendet werden. Während der Bewegungsschätzung kann der Encoder auch wählen, um den Interpolationsfilter zu "verbessern", um die Vorhersageergebnisse zu verbessern. Bewegungsschätzung in H.264, einem Makroblock (MB) 2, kann in unterschiedliche Unterblocke unterteilt werden, die Bildung von sieben verschiedenen Modi der Blockgröße. Diese multimodische flexible und detaillierte Aufteilung des Bildes im Einklang mit der tatsächlichen Form beweglicher Objekte und die Genauigkeit der Bewegungsschätzung erheblich verbessert. Auf diese Weise kann in jedem Makroblock 1,2,4,8 oder 16 Bewegungsvektoren enthalten. In H.264, mit dem der Encoder mehr als einen vorherigen Frame für die Bewegungsschätzung verwenden kann, die als Multi-Rahmen-Referenztechnologie bezeichnet wird. Beispielsweise kann der Encoder für jeden Zielmakroblock zwei oder drei nur eine gute Referenzrahmen -Codierung ausgewählt, und die Anweisungen für jeden Makroblock sind ein Rahmen, der für die Vorhersage verwendet wird.

3, 4 × 4 Integer -Transformationsblöcke

H.264 ähnelt dem vorherigen Standard, basierend auf dem Restblock der Transformationskodierung, aber die Transformation ist eher ein ganzzahliger Operationen als ein realer Operationen, ähnlich wie der Prozess und DCT. Die Vorteile dieses Ansatzes: Im Encoder und Decoder, um dieselbe Präzisionsumwandlung und umgekehrte Transformation zu ermöglichen, einfach zu verwenden, um einen einfachen Fix-Point-Betriebsmodus zu verwenden. Mit anderen Worten, es gibt keinen "Anti-Konversionsfehler". Die Transformationseinheit beträgt 4 × 4 Blöcke, anstatt in der Vergangenheit den 8 × 8 -Block. Da die Blockgröße verwendet wird, um die schmale, präzisere Klassifizierung beweglicher Objekte zu transformieren, so dass nicht nur die Berechnung als die kleineren und die Kanten von sich bewegenden Objekten in den Grenzflächenfehlern stark reduziert werden. Um die Art und Weise zu verändern, wie kleine Teile eines größeren Bildbereichs im glatten Bereich zwischen dem grauen Block keine Unterschiede in der Helligkeit erzeugen können, können Makroblockdaten von 16 Blöcken von 4 × 4 -DC -Koeffizienten rahmen (jedes Stück insgesamt 16) Für die zweite 4 × 4 -Blocktransformation sind die Farbdaten von vier 4 × 4 -Blocke der Gleichstromkoeffizienten (eines für jedes kleine Stück von insgesamt vier) für 2 × 2 -Blocktransformation. H.264 Ratenkontrolle, um die Fähigkeit zu verbessern, die Größe der Schrittänderung der Kontrolle von etwa 12,5%zu quantifizieren, anstatt konstante Wachstumsänderungen. Die Transformationskoeffizienten der normalisierten Amplitude beim Inverse -Quantisierungsprozess werden behandelt, um die Rechenkomplexität zu verringern. Die Farbpidelität des Farbfaktors mit einem kleineren Quantisierungsschritt hervorheben.

Vorherige:Die kurze Einführung der H.264 -IP -Kamera

Nächste:H.264 IP -Kamera -Dekodierung