I punti salienti della tecnologia della fotocamera IP H.264

2022 09/02

1, La progettazione gerarchica dell'algoritmo della telecamera IP H.264 può essere concettualmente diviso in due livelli: il livello di codifica video (VCL: livello di codifica video) è responsabile di contenuti video efficienti, ha affermato il livello di astrazione di rete (NAL: livello di astrazione di rete) è responsabile dei requisiti di rete del modo appropriato per impacchettare e trasferire dati. Tra VCL e NAL definisce l'interfaccia metodi, l'imballaggio e la segnalazione corrispondenti basate su pacchetti sono parte di. Pertanto, elevata efficienza di codifica e attività di rete da VCL e NAL per completare. Layer VCL, incluso la codifica ibrida di compensazione del movimento a blocchi e alcune nuove funzionalità. E, come il precedente standard di codifica video, H.264 non è le funzioni di pretrattamento e post-elaborazione incluse nella bozza, che può aumentare la flessibilità dello standard. NAL è responsabile del segmento di rete utilizzando il formato sottostante per incapsulare i dati, inclusi l'inquadratura, la segnalazione del canale logico, la tempistica o la sequenza dell'uso finale dei segnali informativi. Ad esempio, NAL supporta il canale video a commutazione circuito nel formato di trasmissione, supportare video su Internet utilizzando il formato di trasmissione RTP / UDP / IP. Informazioni sull'intestazione NAL, comprese le proprie informazioni sulla struttura del segmento e le informazioni di caricamento effettive, che la parte superiore dei dati VCL. (Se si utilizza il partizionamento dei dati, i dati possono essere costituiti da diversi componenti).

2, stima del movimento multi-modalità ad alta precisione

H.264 Supporto 1/4 o 1/8 Pixel Precision Motion Vector. Il filtro a 6 tap di precisione da 1/4 pixel può essere utilizzato per ridurre il rumore ad alta frequenza, per 1/8 pixel di precisione del vettore di precisione può essere utilizzato un filtro a 8 TAP più complesso. Durante la stima del movimento, l'encoder può anche scegliere di "migliorare" il filtro di interpolazione per migliorare i risultati della previsione. Stima del movimento in H.264, un macroblocco (MB) 2 può essere diviso in diversi sotto-blocco, la formazione di sette diverse modalità di dimensioni del blocco. Questa divisione flessibile e dettagliata dell'immagine più in modalità in linea con la forma effettiva degli oggetti in movimento, migliorando notevolmente l'accuratezza della stima del movimento. In questo modo, in ciascun blocco macro può contenere vettori di movimento di 1,2,4,8 o 16. In H.264, che consente all'encoder di utilizzare più di un frame precedente per la stima del movimento, che si chiama tecnologia di riferimento multi-frame. Ad esempio, due o tre solo una buona codifica del frame di riferimento, l'encoder selezionerà per ciascun macroblocco target può fornire un frame di previsione migliore e le istruzioni per ciascun blocco macro sono un frame utilizzato per la previsione.

Blocchi di trasformazione intero 3, 4 × 4

H.264 è simile allo standard precedente, in base al blocco residuo di codifica di trasformazione, ma la trasformazione è operazioni interi piuttosto che operazioni reali, simili al processo e al DCT. I vantaggi di questo approccio: nell'encoder e nel decodificatore per consentire la stessa trasformazione di precisione e trasformata inversa, facile da usare una semplice modalità operativa a punto fisso. In altre parole, non esiste un "errore anti-conversione". L'unità di trasformazione è blocchi 4 × 4, anziché in passato utilizzato il blocco 8 × 8. Poiché la dimensione del blocco utilizzata per trasformare la classificazione stretta e più precisa degli oggetti in movimento, in modo che non solo trasformi il calcolo rispetto ai più piccoli e i bordi degli oggetti in movimento negli errori di interfaccia sono notevolmente ridotti. Al fine di trasformare il modo in cui piccoli pezzi di un'area più ampia dell'immagine nell'area liscia tra il blocco grigio non produce differenze nella luminosità può inquadrare i dati di macroblocco di 16 blocchi di coefficienti 4 × 4 cc (ogni pezzo un totale di 16) Per la seconda trasformata a blocchi 4 × 4, i dati di colore di quattro blocchi 4 × 4 di coefficienti DC (uno per ogni piccolo pezzo di quattro) per la trasformazione del blocco 2 × 2. H.264 Controllo del tasso al fine di migliorare la capacità di quantificare l'entità della variazione del passaggio nel controllo di circa il 12,5%, piuttosto che variazioni di crescita costante. Trasformare i coefficienti di ampiezza normalizzata sul processo di quantizzazione inversa per ridurre la complessità computazionale. Per enfatizzare la fedeltà del colore del fattore di colore con una fase di quantizzazione più piccola.

Precedente:La breve introduzione della fotocamera IP H.264

Prossimo:Decodifica della fotocamera IP H.264