Los aspectos más destacados de la tecnología de la cámara IP H.264

2022 09/02

1, el diseño jerárquico del algoritmo de cámara IP H.264 se puede dividir conceptualmente en dos capas: la capa de codificación de video (VCL: capa de codificación de video) es responsable del contenido eficiente de video, dijo la capa de abstracción de red (NAL: capa de abstracción de red) es responsable de los requisitos de red de la forma apropiada de empaquetar y transferir datos. Entre el VCL y NAL define la interfaz que es parte un métodos basados en paquetes, el empaque y la señalización correspondiente de NAL. Por lo tanto, la alta eficiencia de codificación y la tarea amigable con la red por VCL y NAL para completar. La capa VCL, incluida la codificación híbrida de compensación de movimiento basada en bloques, y algunas características nuevas. Y, al igual que el estándar de codificación de video anterior, H.264 no son las funciones de pretratamiento y postprocesamiento incluidas en el borrador, lo que puede aumentar la flexibilidad del estándar. NAL es responsable del segmento de red utilizando el formato subyacente para encapsular los datos, incluidos los marcos, la señalización lógica del canal, la sincronización o la secuencia del uso final de las señales de información. Por ejemplo, NAL admite el canal de video con cambio de circuito en el formato de transmisión, admite video en Internet usando el formato de transmisión RTP / UDP / IP. La información del encabezado NAL, incluida la su propia información de la estructura de segmento y la información de carga real, que la parte superior de los datos de VCL. (Si usa la partición de datos, los datos pueden consistir en varios componentes).

2, estimación de movimiento de alta precisión y modo múltiple

H.264 Soporte 1/4 o 1/8 Vector de movimiento de precisión de píxeles. Se puede utilizar un filtro de 6 tapas de 1/4 píxeles para reducir el ruido de alta frecuencia, para el vector de movimiento de precisión de 1/8 de píxeles se puede usar con un filtro más complejo de 8 tapas. Durante la estimación del movimiento, el codificador también puede optar por "mejorar" el filtro de interpolación para mejorar los resultados de la predicción. Estimación de movimiento en H.264, un macroblock (MB) 2 se puede dividir en un sub-block diferente, la formación de siete modos diferentes de tamaño de bloque. Esta división flexible y detallada de la imagen de varios modos está más en línea con la forma real de los objetos en movimiento, mejorando en gran medida la precisión de la estimación del movimiento. De esta manera, en cada bloque macro puede contener un vectores de movimiento de 1,2,4,8 o 16. En H.264, que permite que el codificador use más de un cuadro anterior para la estimación de movimiento, que se llama tecnología de referencia de múltiples marcos. Por ejemplo, dos o tres solo una buena codificación de cuadro de referencia, el codificador seleccionará para cada macroblock de destino puede dar una mejor marco de predicción, y las instrucciones para cada bloque de macro son un marco que se utiliza para la predicción.

3, 4 × 4 bloques de transformación entera

H.264 es similar al estándar anterior, basado en el bloque residual de la codificación de transformación, pero la transformación es una operación entera en lugar de operaciones reales, similares al proceso y DCT. Las ventajas de este enfoque: en el codificador y el decodificador para permitir la misma transformación de precisión y transformación inversa, fácil de usar un modo de operación de punto fijo fácil. En otras palabras, no hay un "error anti-conversión". La unidad de transformación es de 4 × 4 bloques, en lugar de en el pasado usó el bloque 8 × 8. Como el tamaño del bloque utilizado para transformar la clasificación estrecha y más precisa de los objetos móviles, de modo que no solo transforme el cálculo que el más pequeño, y los bordes de los objetos móviles en los errores de la interfaz se reducen considerablemente. Para transformar la forma en que las piezas pequeñas de un área más grande de la imagen en el área suave entre el bloque gris no producen diferencias en el brillo, pueden enmarcar datos de macrobloque de 16 bloques de coeficientes de 4 × 4 DC (cada pieza un total de 16) Para la segunda transformación de bloque 4 × 4, los datos de color de cuatro bloque 4 × 4 de coeficientes de CC (uno para cada pieza pequeña de un total de cuatro) para la transformación de 2 × 2 bloque. Control de tasa H.264 Para mejorar la capacidad de cuantificar la magnitud del cambio de paso en el control de aproximadamente 12.5%, en lugar de cambios de crecimiento constantes. Los coeficientes de transformación de la amplitud normalizada en el proceso de cuantización inversa se tratan para reducir la complejidad computacional. Para enfatizar la fidelidad del color del factor de color con un paso de cuantización más pequeño.

Anterior:La breve introducción de la cámara IP H.264

Próximo:Decodificación de cámara IP H.264