Dolby Laboratories Licensing Corporation

États‑Unis d’Amérique

Retour au propriétaire

1-100 de 3 882 pour Dolby Laboratories Licensing Corporation Trier par
Recheche Texte
Affiner par
Type PI
        Brevet 3 701
        Marque 181
Juridiction
        États-Unis 2 412
        International 1 203
        Canada 216
        Europe 51
Date
Nouveautés (dernières 4 semaines) 33
2024 avril (MACJ) 12
2024 mars 27
2024 février 18
2024 janvier 23
Voir plus
Classe IPC
H04S 7/00 - Dispositions pour l'indication; Dispositions pour la commande, p.ex. pour la commande de l'équilibrage 525
G10L 19/008 - Codage ou décodage du signal audio multi-canal utilisant la corrélation inter-canaux pour réduire la redondance, p.ex. stéréo combinée, codage d’intensité ou matriçage 469
H04S 3/00 - Systèmes utilisant plus de deux canaux, p.ex. systèmes quadriphoniques 391
G06T 5/00 - Amélioration ou restauration d'image 183
H04N 9/31 - Dispositifs de projection pour la présentation d'images en couleurs 163
Voir plus
Classe NICE
09 - Appareils et instruments scientifiques et électriques 150
42 - Services scientifiques, technologiques et industriels, recherche et conception 46
41 - Éducation, divertissements, activités sportives et culturelles 36
38 - Services de télécommunications 33
37 - Services de construction; extraction minière; installation et réparation 10
Voir plus
Statut
En Instance 313
Enregistré / En vigueur 3 569
  1     2     3     ...     39        Prochaine page

1.

CANVAS SIZE SCALABLE VIDEO CODING

      
Numéro d'application 18544411
Statut En instance
Date de dépôt 2023-12-18
Date de la première publication 2024-04-11
Propriétaire Dolby Laboratories Licensing Corporation (USA)
Inventeur(s)
  • Lu, Taoran
  • Pu, Fangjun
  • Yin, Peng
  • Mccarthy, Sean Thomas
  • Chen, Tao

Abrégé

Methods and systems for canvas size scalability across the same or different bitstream layers of a video coded bitstream are described. Offset parameters for a conformance window, a reference region of interest (ROI) in a reference layer, and a current ROI in a current layer are received. The width and height of a current ROI and a reference ROI are computed based on the offset parameters and they are used to generate a width and height scaling factor to be used by a reference picture resampling unit to generate an output picture based on the current ROI and the reference ROI.

Classes IPC  ?

  • H04N 19/513 - Traitement de vecteurs de mouvement
  • H04N 19/105 - Sélection de l’unité de référence pour la prédiction dans un mode de codage ou de prédiction choisi, p.ex. choix adaptatif de la position et du nombre de pixels utilisés pour la prédiction
  • H04N 19/172 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par l’unité de codage, c. à d. la partie structurelle ou sémantique du signal vidéo étant l’objet ou le sujet du codage adaptatif l’unité étant une zone de l'image, p.ex. un objet la zone étant une image, une trame ou un champ
  • H04N 19/33 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant des techniques hiérarchiques, p.ex. l'échelonnage dans le domaine spatial

2.

METHOD, APPARATUS, AND MEDIUM FOR ENCODING AND DECODING OF AUDIO BITSTREAMS AND ASSOCIATED RETURN CHANNEL INFORMATION

      
Numéro d'application US2023074348
Numéro de publication 2024/076830
Statut Délivré - en vigueur
Date de dépôt 2023-09-15
Date de publication 2024-04-11
Propriétaire
  • DOLBY LABORATORIES LICENSING CORPORATION (USA)
  • DOLBY INTERNATIONAL AB (Irlande)
Inventeur(s)
  • Cartwright, Richard J.
  • Kjörling, Kristofer
  • Eckert, Michael

Abrégé

A method, performed by a device with one or more microphones, for generating an encoded bitstream, the method comprising, capturing, by the one or more microphones, one or more audio signals, analyzing the captured audio signals to determine presence of a wake word, upon detecting presence of a wake word, setting a flag to indicate a speech recognition task is to be performed on the captured audio signals, encoding the captured audio signals, assembling the encoded audio signals and the flag into the encoded bitstream.

Classes IPC  ?

  • G10L 15/08 - Classement ou recherche de la parole
  • G10L 15/22 - Procédures utilisées pendant le processus de reconnaissance de la parole, p.ex. dialogue homme-machine 
  • G10L 15/30 - Reconnaissance distribuée, p.ex. dans les systèmes client-serveur, pour les applications en téléphonie mobile ou réseaux
  • G10L 25/18 - Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par le type de paramètres extraits les paramètres extraits étant l’information spectrale de chaque sous-bande
  • G10L 25/24 - Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par le type de paramètres extraits les paramètres extraits étant le cepstre

3.

METHODS, APPARATUS AND SYSTEMS FOR PERFORMING PERCEPTUALLY MOTIVATED GAIN CONTROL

      
Numéro d'application US2023073365
Numéro de publication 2024/076810
Statut Délivré - en vigueur
Date de dépôt 2023-09-01
Date de publication 2024-04-11
Propriétaire
  • DOLBY LABORATORIES LICENSING CORPORATION (USA)
  • DOLBY INTERNATIONAL AB (Irlande)
Inventeur(s)
  • Setiawan, Panji
  • Mcdonald, Benjamin Gilbert
  • Tyagi, Rishabh

Abrégé

Systems, methods, and computer program products for performing gain control on audio signals are provided. An automatic gain control system obtains a downmixed audio signal of an audio signal to be encoded. The system determines that an overload condition has occurred for a frame of the downmixed audio signal. Responsive to the overload condition, the system determines a gain transition function for the frame, wherein the gain transition function is based at least on a gain transition step size. The system applies the gain transition function to the frame to generate a gain adjusted frame of the downmixed audio signal. The system provides the gain adjusted frame and information indicative of the gain transition function for encoding by an encoder.

Classes IPC  ?

  • G10L 19/008 - Codage ou décodage du signal audio multi-canal utilisant la corrélation inter-canaux pour réduire la redondance, p.ex. stéréo combinée, codage d’intensité ou matriçage

4.

METHOD, APPARATUS, AND MEDIUM FOR ENCODING AND DECODING OF AUDIO BITSTREAMS WITH PARAMETRIC FLEXIBLE RENDERING CONFIGURATION DATA

      
Numéro d'application US2023074310
Numéro de publication 2024/076828
Statut Délivré - en vigueur
Date de dépôt 2023-09-15
Date de publication 2024-04-11
Propriétaire
  • DOLBY LABORATORIES LICENSING CORPORATION (USA)
  • DOLBY INTERNATIONAL AB (Irlande)
Inventeur(s)
  • Kjoerling, Kristofer
  • Purnhagen, Heiko
  • Seefeldt, Alan J.
  • Lando, Joshua B.

Abrégé

A method for generating an encoded bitstream from an audio program comprising a plurality of audio signals, the method comprising receiving, for each of the plurality of audio signals, information indicating a playback device with which the respective audio signal is associated, receiving, for each playback device, information indicating at least one of a delay, a gain, and an equalization curve associated with the respective playback device, determining, from the plurality of audio signals, a group of two or more related audio signals, applying one or more joint-coding tools to the two or more related audio signals of the group to obtain jointly-coded audio signals, and combining the jointly-coded audio signals, an indication of the playback devices with which the jointly-coded audio signals are associated, and indications of the delay and the gain associated with the respective playback devices with which the jointly-coded audio signals are associated, into an independent block of an encoded bitstream.

Classes IPC  ?

  • G10L 19/008 - Codage ou décodage du signal audio multi-canal utilisant la corrélation inter-canaux pour réduire la redondance, p.ex. stéréo combinée, codage d’intensité ou matriçage
  • G10L 19/16 - Architecture de vocodeur

5.

A METHOD, APPARATUS, AND MEDIUM FOR ENCODING AND DECODING OF AUDIO BITSTREAMS AND ASSOCIATED ECHO-REFERENCE SIGNALS

      
Numéro d'application US2023074317
Numéro de publication 2024/076829
Statut Délivré - en vigueur
Date de dépôt 2023-09-15
Date de publication 2024-04-11
Propriétaire
  • DOLBY LABORATORIES LICENSING CORPORATION (USA)
  • DOLBY INTERNATIONAL AB (Irlande)
Inventeur(s)
  • Kjörling, Kristofer
  • Purnhagen, Heiko
  • Gunawan, David
  • Southwell, Benjamin
  • Samuelsson, Leif

Abrégé

A method for generating a frame of an encoded bitstream of an audio program comprising a plurality of audio signals, wherein the frame comprises two or more independent blocks of encoded data, the method comprising receiving, for one or more of the plurality of audio signals, information indicating a playback device with which the one or more audio signals are associated, receiving, for the indicated playback device, information indicating one or more additional associated playback devices, receiving one or more audio signals associated with the indicated one or more additional associated playback devices, encoding the one or more audio signals associated with the playback device, encoding the one or more audio signals associated with the indicated one or more additional associated playback devices, combining the one or more encoded audio signals associated with the playback device and signaling information indicating the one or more additional associated playback devices into a first independent block, combining the one or more encoded audio signals associated with the one or more additional associated playback devices into one or more additional independent blocks, and combining the first independent block and the one or more additional independent blocks into the frame of the encoded bitstream.

Classes IPC  ?

  • G10L 19/008 - Codage ou décodage du signal audio multi-canal utilisant la corrélation inter-canaux pour réduire la redondance, p.ex. stéréo combinée, codage d’intensité ou matriçage
  • G10L 19/16 - Architecture de vocodeur
  • H04S 3/00 - Systèmes utilisant plus de deux canaux, p.ex. systèmes quadriphoniques

6.

INTRA-PREDICTION FOR HEXAGONALLY-SAMPLED VIDEO AND IMAGE COMPRESSION

      
Numéro d'application 18264311
Statut En instance
Date de dépôt 2022-02-10
Date de la première publication 2024-04-04
Propriétaire Dolby Laboratories Licensing Corporation (USA)
Inventeur(s)
  • Zhang, Zhaobin
  • Gadgil, Neeraj J.
  • Su, Guan-Ming

Abrégé

Methods, systems, and devices implement intra-prediction for hexagonally-sampled compression and decompression of videos and images having a regular grid of hexagonally-shaped pixels. For encoding, a prediction unit (PU) shape is selected at a sequence level from the group consisting of parallelogram, zigzag-square, hexagonal super-pixel, a rectangular zigzag and an arrow, and the hexagonally-sampled image is divided into regions based on the PU shape. For each region: a prediction mode and a PU size are determined; reference pixels are determined for each predicted pixel in the PU shape based on the prediction mode; a weighted factor is determined for each of the reference pixels based on a distance between the reference pixel and the predicted pixel; and a predicted value of each of the predicted pixels in the PU shape is determined using the corresponding reference pixels and the weighted factors.

Classes IPC  ?

  • H04N 19/105 - Sélection de l’unité de référence pour la prédiction dans un mode de codage ou de prédiction choisi, p.ex. choix adaptatif de la position et du nombre de pixels utilisés pour la prédiction
  • H04N 19/119 - Aspects de subdivision adaptative, p.ex. subdivision d’une image en blocs de codage rectangulaires ou non
  • H04N 19/159 - Type de prédiction, p.ex. prédiction intra-trame, inter-trame ou de trame bidirectionnelle
  • H04N 19/176 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par l’unité de codage, c. à d. la partie structurelle ou sémantique du signal vidéo étant l’objet ou le sujet du codage adaptatif l’unité étant une zone de l'image, p.ex. un objet la zone étant un bloc, p.ex. un macrobloc

7.

REPRESENTING SPATIAL AUDIO BY MEANS OF AN AUDIO SIGNAL AND ASSOCIATED METADATA

      
Numéro d'application 18465636
Statut En instance
Date de dépôt 2023-09-12
Date de la première publication 2024-04-04
Propriétaire
  • DOLBY INTERNATIONAL AB (Irlande)
  • DOLBY LABORATORIES LICENSING CORPORATION (USA)
Inventeur(s) Bruhn, Stefan

Abrégé

There is provided encoding and decoding methods for representing spatial audio that is a combination of directional sound and diffuse sound. An exemplary encoding method includes inter alia creating a single- or multi-channel downmix audio signal by downmixing input audio signals from a plurality of microphones in an audio capture unit capturing the spatial audio; determining first metadata parameters associated with the downmix audio signal, wherein the first metadata parameters are indicative of one or more of: a relative time delay value, a gain value, and a phase value associated with each input audio signal; and combining the created downmix audio signal and the first metadata parameters into a representation of the spatial audio.

Classes IPC  ?

  • H04S 3/02 - Systèmes utilisant plus de deux canaux, p.ex. systèmes quadriphoniques du type matriciel, c. à d. dans lesquels les signaux d'entrée sont combinés algébriquement, p.ex. après avoir été déphasés les uns par rapport aux autres

8.

AUDIO FILTERBANK WITH DECORRELATING COMPONENTS

      
Numéro d'application 17683762
Statut En instance
Date de dépôt 2020-09-02
Date de la première publication 2024-04-04
Propriétaire Dolby Laboratories Licensing Corporation (USA)
Inventeur(s) Mcgrath, David S.

Abrégé

An multi-input, multi-output audio process is implemented as a linear system for use in an audio filterbank to convert a set of frequency-domain input audio signals into a set of frequency-domain output audio signals. A transfer function from one input to one output is defined as a frequency dependent gain function. In some implementations, the transfer function includes a direct component that is substantially defined as a frequency dependent gain, and one or more decorrelated components that have frequency-varying group phase response. The transfer function is formed from a set of sub-band functions, with each sub-band function being formed from a set of corresponding component transfer functions including direct component and one or more decorrelated components.

Classes IPC  ?

  • H04S 3/02 - Systèmes utilisant plus de deux canaux, p.ex. systèmes quadriphoniques du type matriciel, c. à d. dans lesquels les signaux d'entrée sont combinés algébriquement, p.ex. après avoir été déphasés les uns par rapport aux autres
  • H04S 5/00 - Systèmes pseudo-stéréophoniques, p.ex. dans lesquels les signaux d'un canal supplémentaire sont dérivés du signal monophonique par déphasage, retardement ou réverbération

9.

CROSS-ASSET GUIDE CHROMA REFORMATTING FOR MULTI-ASSET IMAGING FORMAT

      
Numéro d'application 18460377
Statut En instance
Date de dépôt 2023-09-01
Date de la première publication 2024-04-04
Propriétaire Dolby Laboratories Licensing Corporation (USA)
Inventeur(s)
  • Choudhury, Anustup Kumar Atanu
  • Su, Guan-Ming

Abrégé

A first image and a second image of different dynamic ranges are derived from the same source image. Based on a chroma sampling format of the first image, it is determined whether edge preserving filtering is to be used to generate chroma upsampled image data in a reconstructed image. If so, image metadata for performing the edge preserving filtering is generated. The first image, the second image and the image metadata are encoded into an image data container to enable a recipient device to generate the reconstructed image.

Classes IPC  ?

  • H04N 19/184 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par l’unité de codage, c. à d. la partie structurelle ou sémantique du signal vidéo étant l’objet ou le sujet du codage adaptatif l’unité étant des bits, p.ex. de flux vidéo compressé
  • G06V 10/25 - Détermination d’une région d’intérêt [ROI] ou d’un volume d’intérêt [VOI]
  • H04N 19/117 - Filtres, p.ex. pour le pré-traitement ou le post-traitement
  • H04N 19/172 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par l’unité de codage, c. à d. la partie structurelle ou sémantique du signal vidéo étant l’objet ou le sujet du codage adaptatif l’unité étant une zone de l'image, p.ex. un objet la zone étant une image, une trame ou un champ
  • H04N 19/59 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage prédictif mettant en œuvre un sous-échantillonnage spatial ou une interpolation spatiale, p.ex. modification de la taille de l’image ou de la résolution
  • H04N 19/98 - Codage de plage-dynamique adaptative [ADRC]

10.

PROGRESSIVE CALCULATION AND APPLICATION OF RENDERING CONFIGURATIONS FOR DYNAMIC APPLICATIONS

      
Numéro d'application 18255582
Statut En instance
Date de dépôt 2021-12-02
Date de la première publication 2024-04-04
Propriétaire DOLBY LABORATORIES LICENSING CORPORATION (USA)
Inventeur(s)
  • Lando, Joshua B.
  • Seefeldt, Alan J.

Abrégé

Some examples involve rendering received audio data by determining a first relative activation of a set of loudspeakers in an environment according to a first rendering configuration corresponding to a first set of speaker activations, receiving a first rendering transition indication indicating a transition from the first rendering configuration to a second rendering configuration and determining a second set of speaker activations corresponding to a simplified version of the second rendering configuration. Some examples involve performing a first transition from the first set of speaker activations to the second set of speaker activations, determining a third set of speaker activations corresponding to a complete version of the second rendering configuration and performing a second transition to the third set of speaker activations without requiring completion of the first transition.

Classes IPC  ?

  • H04S 7/00 - Dispositions pour l'indication; Dispositions pour la commande, p.ex. pour la commande de l'équilibrage

11.

FREQUENCY DOMAIN MULTIPLEXING OF SPATIAL AUDIO FOR MULTIPLE LISTENER SWEET SPOTS

      
Numéro d'application 18255309
Statut En instance
Date de dépôt 2021-12-02
Date de la première publication 2024-04-04
Propriétaire Dolby Laboratories Licensing Corporation (USA)
Inventeur(s)
  • Seefeldt, Alan J.
  • Brown, C. Phillip

Abrégé

Some methods involve receiving, by a control system that is configured for implementing a plurality of renderers, audio data and listening configuration data for a plurality of listening configurations, each listening configuration of the plurality of listening configurations corresponding to a listening position and a listening orientation in an audio environment, and rendering, by each renderer and according to the listening configuration data, the received audio data to obtain a set of renderer-specific loudspeaker feed signals for a corresponding listening configuration. Each renderer may be configured to render the audio data for a different listening configuration. Some such methods may involve decomposing each set of renderer-specific loudspeaker feed signals into a renderer-specific set of frequency bands and combining the renderer-specific frequency bands of each renderer to produce an output set of loudspeaker feed signals.

Classes IPC  ?

  • H04S 7/00 - Dispositions pour l'indication; Dispositions pour la commande, p.ex. pour la commande de l'équilibrage

12.

NEURAL SEGMENTATION FIELDS FOR REPRESENTING THREE-DIMENSIONAL SCENES

      
Numéro d'application US2023073251
Numéro de publication 2024/073214
Statut Délivré - en vigueur
Date de dépôt 2023-08-31
Date de publication 2024-04-04
Propriétaire DOLBY LABORATORIES LICENSING CORPORATION (USA)
Inventeur(s)
  • Tu, Peihan
  • Huang, Tsung-Wei
  • Su, Guan-Ming

Abrégé

Methods and apparatus for rendering segmentation maps of a 3D scene using machine learning. According to an example embodiment, a method of training a neural network to render segmentation maps corresponding to arbitrarily selected views of a 3D scene comprises: computing color texture and volume density corresponding to a selected training view of the 3D scene, the computing being performed using a 3D representation pretrained to represent the 3D scene; generating a predicted segmentation map corresponding to the selected training view of the 3D scene, the generating being performed using the neural network based on said color texture and said volume density; and adjusting configuration parameters of network nodes of the neural network based on a loss function configured to receive, as a first input thereof, a ground-truth segmentation map corresponding to the selected training view and further configured to receive, as a second input thereof, the predicted segmentation map.

Classes IPC  ?

13.

FREQUENCY DOMAIN MULTIPLEXING OF SPATIAL AUDIO FOR MULTIPLE LISTENER SWEET SPOTS

      
Numéro d'application 18255251
Statut En instance
Date de dépôt 2021-12-02
Date de la première publication 2024-03-28
Propriétaire Dolby Laboratories Licensing Corporation (USA)
Inventeur(s)
  • Seefeldt, Alan J.
  • Brown, C. Phillip

Abrégé

Some methods involve receiving, by a control system configured for implementing a plurality of Tenderers, audio data and listening configuration data for a plurality of listening configurations, each listening configuration of the plurality of listening configurations corresponding to a listening position and a listening orientation in an audio environment, and rendering, by each Tenderer and according to the listening configuration data, the received audio data to obtain a set of Tenderer-specific loudspeaker feed signals for a corresponding listening configuration. Each Tenderer may be configured to render the audio data for a different listening configuration. Some such methods may involve decomposing each set of renderer-specific loudspeaker feed signals into a Tenderer-specific set of frequency bands and combining the renderer-specific frequency bands of each Tenderer to produce an output set of loudspeaker feed signals. Some such methods may involve outputting the output set of loudspeaker feed signals to a plurality of loudspeakers.

Classes IPC  ?

  • H04S 7/00 - Dispositions pour l'indication; Dispositions pour la commande, p.ex. pour la commande de l'équilibrage

14.

SPATIAL NOISE FILLING IN MULTI-CHANNEL CODEC

      
Numéro d'application 18255506
Statut En instance
Date de dépôt 2021-12-01
Date de la première publication 2024-03-28
Propriétaire Dolby Laboratories Licensing Corporation (USA)
Inventeur(s)
  • Tyagi, Rishabh
  • Eckert, Michael

Abrégé

Embodiments are disclosed for spatial noise filling in multi-channel codecs. In an embodiment, a method of regenerating background noise ambience in a multi-channel codec by generating spatial hole filling noise comprises: computing noise estimates based on a primary downmix channel generated from an input audio signal representing a spatial audio scene with background noise ambience; computing spectral shaping filter coefficients based on the noise estimates; spectrally shaping the multi-channel noise signal using the spectral shaping filter coefficients and a noise distribution, the spectral shaping resulting in a diffused, multi-channel noise signal with uncorrelated channels; spatially shaping the diffused, uncorrelated multi-channel noise signal with uncorrelated channels based on a noise ambience of the spatial audio scene; and adding the spatially and spectrally shaped multi-channel noise to a multi-channel codec output to synthesize the background noise ambience of the spatial audio scene.

Classes IPC  ?

  • G10L 19/03 - Prédiction spectrale pour empêcher le pré-écho; Mise en forme de bruit temporaire [TNS], p.ex. dans MPEG2 ou MPEG4
  • G10L 19/008 - Codage ou décodage du signal audio multi-canal utilisant la corrélation inter-canaux pour réduire la redondance, p.ex. stéréo combinée, codage d’intensité ou matriçage
  • G10L 21/0216 - Filtration du bruit caractérisée par le procédé d’estimation du bruit

15.

SINGLE CHANNEL ENCODING INTO A MULTI-CHANNEL CONTAINER FOLLOWED BY IMAGE COMPRESSION

      
Numéro d'application US2023032786
Numéro de publication 2024/064014
Statut Délivré - en vigueur
Date de dépôt 2023-09-14
Date de publication 2024-03-28
Propriétaire DOLBY LABORATORIES LICENSING CORPORATION (USA)
Inventeur(s) Ten, Arkady

Abrégé

Coding methods and apparatus for packing single-channel data into a multi-channel container, e.g., an MP4, TIFF, or JPEG container, to at least achieve good utilization of the container's data capacity. In some examples, a coding method comprises: converting a plurality of scalar values of a received data stream into a corresponding plurality of n-dimensional values, the converting being performed using a mapper; assigning each of the n-dimensional values as a pixel value to a respective pixel of a virtual-image frame, where n is an integer greater than one; and compressing the virtual-image frame according to a type of a container for image data. The mapper is configured to map a scalar value to a corresponding n-dimensional value based on a relationship represented by an n-dimensional curve or by a plurality of 2n-way tree partitions of n-dimensional space.

Classes IPC  ?

  • H04N 19/85 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le pré-traitement ou le post-traitement spécialement adaptés pour la compression vidéo
  • H04N 19/88 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le pré-traitement ou le post-traitement spécialement adaptés pour la compression vidéo mettant en œuvre la réorganisation de données entre différentes unités de codage, p.ex. redistribution, entrelacement, brouillage ou permutation de données de pixel ou permutation de données de coefficients de transformée entre différents blocs
  • H04N 19/90 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant des techniques de codage non prévues dans les groupes , p.ex. les fractales
  • G06T 9/00 - Codage d'image
  • H04N 13/161 - Encodage, multiplexage ou démultiplexage de différentes composantes des signaux d’images

16.

SYSTEM AND METHOD FOR OPTIMIZING LOUDNESS AND DYNAMIC RANGE ACROSS DIFFERENT PLAYBACK DEVICES

      
Numéro d'application 18483082
Statut En instance
Date de dépôt 2023-10-09
Date de la première publication 2024-03-28
Propriétaire
  • DOLBY LABORATORIES LICENSING CORPORATION (USA)
  • DOLBY INTERNATIONAL AB (Irlande)
Inventeur(s)
  • Riedmiller, Jeffrey
  • Norcross, Scott Gregory
  • Roeden, Karl Jonas

Abrégé

Embodiments are directed to a method and system for receiving, in a bitstream, metadata associated with the audio data, and analyzing the metadata to determine whether a loudness parameter for a first group of audio playback devices are available in the bitstream. Responsive to determining that the parameters are present for the first group, the system uses the parameters and audio data to render audio. Responsive to determining that the loudness parameters are not present for the first group, the system analyzes one or more characteristics of the first group, and determines the parameter based on the one or more characteristics.

Classes IPC  ?

  • G06F 3/16 - Entrée acoustique; Sortie acoustique
  • H03G 9/00 - Combinaisons de plusieurs types de commande, p.ex. commande de gain et commande de tonalité
  • H04R 29/00 - Dispositifs de contrôle; Dispositifs de tests

17.

Audio Encoding and Decoding Using Presentation Transform Parameters

      
Numéro d'application 18487232
Statut En instance
Date de dépôt 2023-10-16
Date de la première publication 2024-03-28
Propriétaire
  • DOLBY LABORATORIES LICENSING CORPORATION (USA)
  • DOLBY INTERNATIONAL AB (Irlande)
Inventeur(s)
  • Breebaart, Dirk Jeroen
  • Cooper, David Matthew
  • Samuelsson, Leif Jonas
  • Koppens, Jeroen
  • Wilson, Rhonda J.
  • Purnhagen, Heiko
  • Stahlmann, Alexander

Abrégé

A method for encoding an input audio stream including the steps of obtaining a first playback stream presentation of the input audio stream intended for reproduction on a first audio reproduction system, obtaining a second playback stream presentation of the input audio stream intended for reproduction on a second audio reproduction system, determining a set of transform parameters suitable for transforming an intermediate playback stream presentation to an approximation of the second playback stream presentation, wherein the transform parameters are determined by minimization of a measure of a difference between the approximation of the second playback stream presentation and the second playback stream presentation, and encoding the first playback stream presentation and the set of transform parameters for transmission to a decoder.

Classes IPC  ?

  • G10L 19/008 - Codage ou décodage du signal audio multi-canal utilisant la corrélation inter-canaux pour réduire la redondance, p.ex. stéréo combinée, codage d’intensité ou matriçage
  • G06F 3/16 - Entrée acoustique; Sortie acoustique
  • H04L 65/70 - Mise en paquets adaptés au réseau des données multimédias
  • H04L 65/75 - Gestion des paquets du réseau multimédia
  • H04S 1/00 - Systèmes à deux canaux
  • H04S 7/00 - Dispositions pour l'indication; Dispositions pour la commande, p.ex. pour la commande de l'équilibrage

18.

INSERTION OF FORCED GAPS FOR PERVASIVE LISTENING

      
Numéro d'application 18254962
Statut En instance
Date de dépôt 2021-12-02
Date de la première publication 2024-03-28
Propriétaire Dolby Laboratories Licensing Corporation (USA)
Inventeur(s)
  • Hines, Christopher Graham
  • Southwell, Benjamin John

Abrégé

An attenuation or “gap” may be inserted into at least a first frequency range of at least first and second audio playback signals of a content stream during at least a first time interval to generate at least first and second modified audio playback signals. Corresponding audio device playback sound may be provided by at least first and second audio devices. At least one microphone may detect at least the first audio device playback sound and the second audio device playback sound and may generate corresponding microphone signals. Audio data may be extracted from the microphone signals in at least the first frequency range, to produce extracted audio data. A far-field audio environment impulse response and/or audio environment noise may be estimated based, at least in part, on the extracted audio data.

Classes IPC  ?

  • H04S 7/00 - Dispositions pour l'indication; Dispositions pour la commande, p.ex. pour la commande de l'équilibrage
  • H04S 3/00 - Systèmes utilisant plus de deux canaux, p.ex. systèmes quadriphoniques

19.

IMAGE ENHANCEMENT VIA GLOBAL AND LOCAL RESHAPING

      
Numéro d'application 18262611
Statut En instance
Date de dépôt 2022-01-26
Date de la première publication 2024-03-21
Propriétaire Dolby Laboratories Licensing Corporation (USA)
Inventeur(s)
  • Su, Guan-Ming
  • Kadu, Harshad
  • Klittmark, Per Jonas Andreas
  • Chen, Tao

Abrégé

A first reshaping mapping is performed on a first image represented in a first domain to generate a second image represented in a second domain. The first domain is of a first dynamic range different from a second dynamic range of which the second domain is. A second reshaping mapping is performed on the second image represented in the second domain to generate a third image represented in the first domain. The third image is perceptually different from the first image in at least one of: global contrast, global saturation, local contrast, local saturation, etc. A display image is derived from the third image and rendered on a display device.

Classes IPC  ?

  • G06T 5/00 - Amélioration ou restauration d'image
  • G06V 10/60 - Extraction de caractéristiques d’images ou de vidéos relative aux propriétés luminescentes, p.ex. utilisant un modèle de réflectance ou d’éclairage

20.

METHOD AND DEVICE FOR APPLYING DYNAMIC RANGE COMPRESSION TO A HIGHER ORDER AMBISONICS SIGNAL

      
Numéro d'application 18505494
Statut En instance
Date de dépôt 2023-11-09
Date de la première publication 2024-03-21
Propriétaire Dolby Laboratories Licensing Corporation (USA)
Inventeur(s)
  • Boehm, Johannes
  • Keiler, Florian

Abrégé

A method for performing DRC on a HOA signal comprises transforming the HOA signal to the spatial domain, analyzing the transformed HOA signal, and obtaining, from results of said analyzing, gain factors that are usable for dynamic compression. The gain factors can be transmitted together with the HOA signal. When applying the DRC, the HOA signal is transformed to the spatial domain, the gain factors are extracted and multiplied with the transformed HOA signal in the spatial domain, wherein a gain compensated transformed HOA signal is obtained. The gain compensated transformed HOA signal is transformed back into the HOA domain, wherein a gain compensated HOA signal is obtained. The DRC may be applied in the QMF-filter bank domain.

Classes IPC  ?

  • H04S 3/00 - Systèmes utilisant plus de deux canaux, p.ex. systèmes quadriphoniques
  • G10L 19/008 - Codage ou décodage du signal audio multi-canal utilisant la corrélation inter-canaux pour réduire la redondance, p.ex. stéréo combinée, codage d’intensité ou matriçage
  • H04S 3/02 - Systèmes utilisant plus de deux canaux, p.ex. systèmes quadriphoniques du type matriciel, c. à d. dans lesquels les signaux d'entrée sont combinés algébriquement, p.ex. après avoir été déphasés les uns par rapport aux autres

21.

SYSTEMS AND METHODS FOR LOCAL DIMMING IN MULTI-MODULATION DISPLAYS

      
Numéro d'application 18518082
Statut En instance
Date de dépôt 2023-11-22
Date de la première publication 2024-03-21
Propriétaire Dolby Laboratories Licensing Corporation (USA)
Inventeur(s)
  • Shields, Jerome
  • Richards, Martin J.
  • Pertierra, Juan P.

Abrégé

Dual and multi-modulator projector display systems and techniques are disclosed. In one embodiment, a projector display system comprises a light source; a controller, a first modulator, receiving light from the light source and rendering a halftone image of said the input image; a blurring optical system that blurs said halftone image with a Point Spread Function (PSF); and a second modulator receiving the blurred halftone image and rendering a pulse width modulated image which may be projected to form the desired screen image. Systems and techniques for forming a binary halftone image from input image, correcting for misalignment between the first and second modulators and calibrating the projector system—e.g. over time—for continuous image improvement are also disclosed.

Classes IPC  ?

  • H04N 9/31 - Dispositifs de projection pour la présentation d'images en couleurs
  • B65B 11/04 - Enveloppement d'objets ou de quantités de matériaux sans changer leur position durant l'opération, p.ex. dans des moules avec des plieurs à charnières en faisant tourner les objets
  • B65B 11/48 - Enserrage d'objets ou quantités de matériaux, par pliage de l'enveloppe, p.ex. une enveloppe en forme de poche, et en amarrant ses bords opposés libres pour enfermer le contenu
  • B65B 11/58 - Application de plusieurs enveloppes, p.ex. successivement
  • B65B 49/08 - Plioirs oscillants ou à mouvement alternatif
  • B65B 51/06 - Application de bandes adhésives
  • B65B 55/00 - Préservation, protection ou stérilisation des paquets ou de l'ensemble paquet et contenu
  • B65B 61/06 - Dispositifs accessoires, non prévus ailleurs, opérant sur feuilles, flans, bandes, attaches, réceptacles ou paquets pour découper les bandes ou pour séparer les paquets joints par coupe
  • B65B 61/26 - Dispositifs accessoires, non prévus ailleurs, opérant sur feuilles, flans, bandes, attaches, réceptacles ou paquets pour marquer ou coder les paquets achevés
  • G03B 21/00 - Projecteurs ou visionneuses du type par projection; Leurs accessoires
  • G03B 21/13 - Projecteurs pour produire des effets particuliers sur les bords de l'image, p.ex. flou
  • G03B 21/20 - Boîtes à lumière

22.

HEAD TRACKED SPATIAL AUDIO AND/OR VIDEO RENDERING

      
Numéro d'application 18520413
Statut En instance
Date de dépôt 2023-11-27
Date de la première publication 2024-03-21
Propriétaire Dolby Laboratories Licensing Corporation (USA)
Inventeur(s)
  • Ninan, Ajit
  • Rozzi, William Anthony

Abrégé

Images are acquired through image sensors operating in conjunction with a media consumption system. The acquired images are used to determine a user's movement in a plurality of degrees of freedom. Sound images depicted in spatial audio rendered by audio speakers operating in conjunction with the media consumption system are adapted based at least in part on the user's movement in the plurality of degrees of freedom.

Classes IPC  ?

  • H04S 7/00 - Dispositions pour l'indication; Dispositions pour la commande, p.ex. pour la commande de l'équilibrage
  • G06F 3/01 - Dispositions d'entrée ou dispositions d'entrée et de sortie combinées pour l'interaction entre l'utilisateur et le calculateur
  • G06T 7/20 - Analyse du mouvement
  • G06T 7/73 - Détermination de la position ou de l'orientation des objets ou des caméras utilisant des procédés basés sur les caractéristiques

23.

METHOD OF RENDERING ONE OR MORE CAPTURED AUDIO SOUNDFIELDS TO A LISTENER

      
Numéro d'application 18469498
Statut En instance
Date de dépôt 2023-09-18
Date de la première publication 2024-03-21
Propriétaire DOLBY LABORATORIES LICENSING CORPORATION (USA)
Inventeur(s)
  • Cartwright, Richard J.
  • Mcgrath, David S.
  • Dickins, Glenn N.

Abrégé

A computer implemented system for rendering captured audio soundfields to a listener comprises apparatus to deliver the audio soundfields to the listener. The delivery apparatus delivers the audio soundfields to the listener with first and second audio elements perceived by the listener as emanating from first and second virtual source locations, respectively, and with the first audio element and/or the second audio element delivered to the listener from a third virtual source location. The first virtual source location and the second virtual source location are perceived by the listener as being located to the front of the listener, and the third virtual source location is located to the rear or the side of the listener.

Classes IPC  ?

  • H04S 1/00 - Systèmes à deux canaux
  • H04M 3/56 - Dispositions pour connecter plusieurs abonnés à un circuit commun, c. à d. pour permettre la transmission de conférences
  • H04R 3/12 - Circuits pour transducteurs pour distribuer des signaux à plusieurs haut-parleurs
  • H04R 5/033 - Casques pour communication stéréophonique
  • H04R 5/04 - Circuits
  • H04S 7/00 - Dispositions pour l'indication; Dispositions pour la commande, p.ex. pour la commande de l'équilibrage

24.

AUDIO CHANNEL SPATIAL TRANSLATION

      
Numéro d'application 18474170
Statut En instance
Date de dépôt 2023-09-25
Date de la première publication 2024-03-21
Propriétaire Dolby Laboratories Licensing Corporation (USA)
Inventeur(s) Davis, Mark F.

Abrégé

The present invention is directed to methods and apparatus for translating a first plurality of audio input channels to a second plurality of audio output channels. This includes determining that there is pair-wise coding among any of the first plurality of audio input channels, determining an input/output-mapping matrix for mapping at least a first set of the first plurality of audio input channels to at least a second set of the second plurality of audio output channels; and deriving the second plurality of audio output channels based on first plurality of audio input channels, the input/output-mapping matrix and the determined pair-wise coding. The first plurality of audio input channels represent the same soundfield represented by the second plurality of audio output channels.

Classes IPC  ?

  • H04S 5/00 - Systèmes pseudo-stéréophoniques, p.ex. dans lesquels les signaux d'un canal supplémentaire sont dérivés du signal monophonique par déphasage, retardement ou réverbération

25.

VIDEO CODING METHOD AND APPARATUS USING ANY TYPES OF BLOCK PARTITIONING

      
Numéro d'application 18523309
Statut En instance
Date de dépôt 2023-11-29
Date de la première publication 2024-03-21
Propriétaire Dolby Laboratories Licensing Corporation (USA)
Inventeur(s)
  • Ryu, Ho Chan
  • Ahn, Yong Jo

Abrégé

The present invention relates to a block partitioning structure in video coding technology, and a video encoding and decoding method and apparatus using the same, wherein the video encoding and decoding method includes the steps of: acquiring quad-partitioning information of a block; acquiring bi-partitioning information of the block when the acquired quad-partitioning information of the block does not indicate four partitions; acquiring partitioning direction information for bi-partitioning of the block when the acquired bi-partitioning information of the block indicates two partitions; acquiring information on whether to perform any other type of partitioning, when the acquired bi-partitioning information of the block does not indicate two partitions; and acquiring additional information required for the any other type of partitioning, when the acquired information on whether to perform any other type of partitioning indicates that the any other type of partitioning is performed.

Classes IPC  ?

  • H04N 19/119 - Aspects de subdivision adaptative, p.ex. subdivision d’une image en blocs de codage rectangulaires ou non
  • H04N 19/176 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par l’unité de codage, c. à d. la partie structurelle ou sémantique du signal vidéo étant l’objet ou le sujet du codage adaptatif l’unité étant une zone de l'image, p.ex. un objet la zone étant un bloc, p.ex. un macrobloc
  • H04N 19/46 - Inclusion d’information supplémentaire dans le signal vidéo pendant le processus de compression
  • H04N 19/66 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant la tolérance aux erreurs mettant en œuvre la séparation des données, c. à d. la séparation des données en paquets ou en partitions selon leur importance

26.

HEAD-TRACKED SPLIT RENDERING AND HEAD-RELATED TRANSFER FUNCTION PERSONALIZATION

      
Numéro d'application US2023073857
Numéro de publication 2024/059505
Statut Délivré - en vigueur
Date de dépôt 2023-09-11
Date de publication 2024-03-21
Propriétaire
  • DOLBY LABORATORIES LICENSING CORPORATION (USA)
  • DOLBY INTERNATIONAL AB (Irlande)
Inventeur(s)
  • Bruhn, Stefan
  • Tyagi, Rishabh

Abrégé

Systems, methods and computer program products for direction of arrival (DOA) based head-tracked split rendering and head-related transfer function (HRTF) personalization are described. Head-tracked audio rendering is split between two devices. A first device receives a main bitstream representation of encoded audio. A second device tracks head pose information. The first device decodes the main bitstream using a main decoder, and encodes the decoded bitstream into pre-rendered binaural signals and post-render metadata. The second device decodes the pre-rendered binaural signals and post-renderer metadata from the intermediate bitstream, and provides the decoded pre-rendered binaural signals and post-renderer metadata to a lightweight renderer. The lightweight renderer renders the pre-rendered binaural signals into binaural audio based on the post-renderer metadata, the head pose information, generic HRTF, and personalized HRTF.

Classes IPC  ?

  • H04S 7/00 - Dispositions pour l'indication; Dispositions pour la commande, p.ex. pour la commande de l'équilibrage

27.

SYNCHRONIZATION OF HEAD TRACKING DATA

      
Numéro d'application US2023073623
Numéro de publication 2024/059458
Statut Délivré - en vigueur
Date de dépôt 2023-09-07
Date de publication 2024-03-21
Propriétaire DOLBY LABORATORIES LICENSING CORPORATION (USA)
Inventeur(s)
  • Yu, Xuemei
  • Luo, Libin
  • Liu, Zhifang

Abrégé

Methods, systems, and media for utilizing head tracking data are provided. In some embodiments, a method involves receiving, at each earbud of a pair of communicatively coupled earbuds, sensor data from one or more sensors. The method may involve determining, at each earbud of the pair of communicatively coupled earbuds, head orientation information. The method may involve transmitting the determined head orientation information between the pair of communicatively coupled earbuds such that a leader earbud transmits head orientation information determined by the leader earbud to a follower earbud. The method may involve synchronizing, at each earbud, the determined head orientation data based at least in part on timing information associated with a timestamp at which the head orientation information was transmitted. The method may involve utilizing the synchronized head orientation data to present audio content by each earbud of the pair of communicatively coupled earbuds.

Classes IPC  ?

  • H04S 7/00 - Dispositions pour l'indication; Dispositions pour la commande, p.ex. pour la commande de l'équilibrage
  • H04R 1/10 - Ecouteurs; Leurs fixations

28.

AUDIO-VISUAL ANALYTIC FOR OBJECT RENDERING IN CAPTURE

      
Numéro d'application US2023073930
Numéro de publication 2024/059536
Statut Délivré - en vigueur
Date de dépôt 2023-09-12
Date de publication 2024-03-21
Propriétaire DOLBY LABORATORIES LICENSING CORPORATION (USA)
Inventeur(s)
  • Sun, Jundai
  • Fanelli, Andrea
  • Shuang, Zhiwei

Abrégé

A system and method for the generation of automatic audio-visual analytics for object rendering in capture. One example provides a method of processing audiovisual content. The method includes receiving content including a plurality of audio frames and a plurality of video frames, classifying each of the plurality of audio frames into a plurality of audio classifications, and classifying each of the plurality of video frames into a plurality of video classifications. The method includes processing the plurality of audio frames based on the respective audio classifications and processing the plurality of video frames based on the respective video classifications. Each audio classification is processed with a different audio processing operation, and each video classification is processed with a different video processing operation. The method includes generating an audio/video representation of the content by merging the processed plurality of audio frames and the processed plurality of video frames.

Classes IPC  ?

  • H04N 21/233 - Traitement de flux audio élémentaires
  • H04N 5/14 - Circuits de signal d'image pour le domaine des fréquences vidéo
  • H04N 21/234 - Traitement de flux vidéo élémentaires, p.ex. raccordement de flux vidéo ou transformation de graphes de scènes MPEG-4
  • H04N 21/439 - Traitement de flux audio élémentaires
  • H04N 21/44 - Traitement de flux élémentaires vidéo, p.ex. raccordement d'un clip vidéo récupéré d'un stockage local avec un flux vidéo en entrée ou rendu de scènes selon des graphes de scène MPEG-4

29.

TILTED SLOT WAVEGUIDE

      
Numéro d'application US2023072806
Numéro de publication 2024/054760
Statut Délivré - en vigueur
Date de dépôt 2023-08-24
Date de publication 2024-03-14
Propriétaire DOLBY LABORATORIES LICENSING CORPORATION (USA)
Inventeur(s)
  • Griffiths, Kelvin, Francis
  • Smithers, Michael, J.

Abrégé

A loudspeaker assembly including a wedge-shaped acoustic waveguide and an audio driver. The wedge-shaped acoustic waveguide includes a first face including a slot opening formed therein, a second face joined at an edge with the first face, the second face tilted relative to the first face by a first angle, and a surface disposed opposite the edge and connected between the first face and the second face. The audio driver is coupled to the second face such that the audio driver is tilted at the first angle relative to the first face. The first face is oriented to face in a first direction and the audio driver is oriented to face in a second direction. A pressure level of sound energy emitted by the audio driver is greater along the second direction than the first direction. A vehicle comprising: a passenger cabin, a pillar extending upwards at a first angle relative to the passenger cabin, and the loudspeaker assembly installed on the pillar.

Classes IPC  ?

  • H04R 1/34 - Dispositions pour obtenir la fréquence désirée ou les caractéristiques directionnelles pour obtenir la caractéristique directionnelle désirée uniquement en utilisant un seul transducteur avec des moyens réfléchissant, diffractant, dirigeant ou guidant des sons
  • B60R 11/02 - Autres aménagements pour tenir ou monter des objets pour postes radio, de télévision, téléphones, ou objets similaires; Disposition de leur commande

30.

Frame-rate scalable video coding

      
Numéro d'application 18506758
Numéro de brevet 11936888
Statut Délivré - en vigueur
Date de dépôt 2023-11-10
Date de la première publication 2024-03-14
Date d'octroi 2024-03-19
Propriétaire DOLBY LABORATORIES LICENSING CORPORATION (USA)
Inventeur(s)
  • Atkins, Robin
  • Yin, Peng
  • Lu, Taoran
  • Pu, Fangjun
  • Mccarthy, Sean Thomas
  • Husak, Walter J.
  • Chen, Tao
  • Su, Guan-Ming

Abrégé

Methods and systems for frame rate scalability are described. Support is provided for input and output video sequences with variable frame rate and variable shutter angle across scenes, or for input video sequences with fixed input frame rate and input shutter angle, but allowing a decoder to generate a video output at a different output frame rate and shutter angle than the corresponding input values. Techniques allowing a decoder to decode more computationally-efficiently a specific backward compatible target frame rate and shutter angle among those allowed are also presented.

Classes IPC  ?

  • H04N 19/172 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par l’unité de codage, c. à d. la partie structurelle ou sémantique du signal vidéo étant l’objet ou le sujet du codage adaptatif l’unité étant une zone de l'image, p.ex. un objet la zone étant une image, une trame ou un champ
  • H04N 19/187 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par l’unité de codage, c. à d. la partie structurelle ou sémantique du signal vidéo étant l’objet ou le sujet du codage adaptatif l’unité étant une couche de vidéo échelonnable
  • H04N 19/30 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant des techniques hiérarchiques, p.ex. l'échelonnage
  • H04N 19/31 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant des techniques hiérarchiques, p.ex. l'échelonnage dans le domaine temporel
  • H04N 19/46 - Inclusion d’information supplémentaire dans le signal vidéo pendant le processus de compression
  • H04N 19/70 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques caractérisés par des aspects de syntaxe liés au codage vidéo, p.ex. liés aux standards de compression

31.

IMAGE ENCODING AND DECODING APPARATUS, AND IMAGE ENCODING AND DECODING METHOD

      
Numéro d'application 18516398
Statut En instance
Date de dépôt 2023-11-21
Date de la première publication 2024-03-14
Propriétaire Dolby Laboratories Licensing Corporation (USA)
Inventeur(s)
  • Han, Jong Ki
  • Seo, Chan Won
  • Choi, Kwang Hyun

Abrégé

According to the present invention, an adaptive scheme is applied to an image encoding apparatus that includes an inter-predictor, an intra-predictor, a transformer, a quantizer, an inverse quantizer, and an inverse transformer, wherein input images are classified into two or more different categories, and two or more modules from among the inter-predictor, the intra-predictor, the transformer, the quantizer, and the inverse quantizer are implemented to perform respective operations in different schemes according to the category to which an input image belongs. Thus, the invention has the advantage of efficiently encoding an image without the loss of important information as compared to a conventional image encoding apparatus which adopts a packaged scheme.

Classes IPC  ?

  • H04N 19/124 - Quantification
  • H04L 45/745 - Recherche de table d'adresses; Filtrage d'adresses
  • H04N 19/11 - Sélection du mode de codage ou du mode de prédiction parmi plusieurs modes de codage prédictif spatial
  • H04N 19/117 - Filtres, p.ex. pour le pré-traitement ou le post-traitement
  • H04N 19/12 - Sélection parmi plusieurs transformées ou standards, p.ex. sélection entre une transformée en cosinus discrète [TCD] et une transformée en sous-bandes ou sélection entre H.263 et H.264
  • H04N 19/136 - Caractéristiques ou propriétés du signal vidéo entrant
  • H04N 19/14 - Complexité de l’unité de codage, p.ex. activité ou estimation de présence de contours
  • H04N 19/159 - Type de prédiction, p.ex. prédiction intra-trame, inter-trame ou de trame bidirectionnelle
  • H04N 19/176 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par l’unité de codage, c. à d. la partie structurelle ou sémantique du signal vidéo étant l’objet ou le sujet du codage adaptatif l’unité étant une zone de l'image, p.ex. un objet la zone étant un bloc, p.ex. un macrobloc
  • H04N 19/61 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant un codage par transformée combiné avec un codage prédictif

32.

PIXEL SHIFTING METHODS IN PROJECTION SYSTEMS

      
Numéro d'application US2023073288
Numéro de publication 2024/054778
Statut Délivré - en vigueur
Date de dépôt 2023-09-01
Date de publication 2024-03-14
Propriétaire DOLBY LABORATORIES LICENSING CORPORATION (USA)
Inventeur(s)
  • Orlick, Christopher John
  • Miller, Jon Scott

Abrégé

A projection system for pixel shifting comprising a light source configured to emit light and a spatial light modulator configured to receive the light and generate a modulated light. The spatial light modulator includes a plurality of micromirrors. The projection system includes a wobulation device configured to shift the modulated light by fractional pixels. The projection system includes a controller configured to, for each of a plurality of subperiods, control the light source to emit the light onto the spatial light modulator, and between each of the plurality of subperiods and with the wobulation device, shift the modulated light by a partial pixel distance greater than a half-pixel distance.

Classes IPC  ?

  • H04N 9/31 - Dispositifs de projection pour la présentation d'images en couleurs
  • H04N 5/74 - Dispositifs de projection pour reproduction d'image, p.ex. eidophor
  • G02B 26/08 - Dispositifs ou dispositions optiques pour la commande de la lumière utilisant des éléments optiques mobiles ou déformables pour commander la direction de la lumière
  • G03B 21/00 - Projecteurs ou visionneuses du type par projection; Leurs accessoires
  • G09G 3/00 - Dispositions ou circuits de commande présentant un intérêt uniquement pour l'affichage utilisant des moyens de visualisation autres que les tubes à rayons cathodiques

33.

SCALABLE 3D SCENE REPRESENTATION USING NEURAL FIELD MODELING

      
Numéro d'application US2023073486
Numéro de publication 2024/054804
Statut Délivré - en vigueur
Date de dépôt 2023-09-05
Date de publication 2024-03-14
Propriétaire DOLBY LABORATORIES LICENSING CORPORATION (USA)
Inventeur(s)
  • Su, Guan-Ming
  • Yin, Peng
  • Choudhury, Anustup Kumar Atanu
  • Lu, Taoran

Abrégé

Methods, systems, and bitstream syntax are described for a scalable 3D scene representation. A general framework presents a dual-layer architecture where a base layer provides a baseline scene representation, and an enhancement layer provides enhancement information under a variety of scalability criteria. The enhancement information is coded using a trained neural field. Example systems are provided using a PSNR criterion and a baseline multi-plane image (MPI) representation. Examples of bitstream syntax for metadata information are also provided.

Classes IPC  ?

  • H04N 19/30 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant des techniques hiérarchiques, p.ex. l'échelonnage
  • H04N 19/46 - Inclusion d’information supplémentaire dans le signal vidéo pendant le processus de compression
  • H04N 19/597 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage prédictif spécialement adapté pour l’encodage de séquences vidéo multi-vues

34.

METHODS AND SYSTEMS FOR RENDERING OBJECT BASED AUDIO

      
Numéro d'application 18470165
Statut En instance
Date de dépôt 2023-09-19
Date de la première publication 2024-03-07
Propriétaire
  • Dolby Laboratories Licensing Corporation (USA)
  • DOLBY INTERNATIONAL AB (Irlande)
Inventeur(s)
  • Mehta, Sripal S.
  • Ziegler, Thomas
  • Baker, Giles
  • Riedmiller, Jeffrey
  • Saungsomboon, Prinyar

Abrégé

Methods for generating an object based audio program, renderable in a personalizable manner, and including a bed of speaker channels renderable in the absence of selection of other program content (e.g., to provide a default full range audio experience). Other embodiments include steps of delivering, decoding, and/or rendering such a program. Rendering of content of the bed, or of a selected mix of other content of the program, may provide an immersive experience. The program may include multiple object channels (e.g., object channels indicative of user-selectable and user-configurable objects), the bed of speaker channels, and other speaker channels. Another aspect is an audio processing unit (e.g., encoder or decoder) configured to perform, or which includes a buffer memory which stores at least one frame (or other segment) of an object based audio program (or bitstream thereof) generated in accordance with, any embodiment of the method.

Classes IPC  ?

  • G10L 19/008 - Codage ou décodage du signal audio multi-canal utilisant la corrélation inter-canaux pour réduire la redondance, p.ex. stéréo combinée, codage d’intensité ou matriçage
  • G06F 3/16 - Entrée acoustique; Sortie acoustique
  • G10L 19/20 - Vocodeurs utilisant des modes multiples utilisant un codage spécifique de la catégorie de son, des encodeurs hybrides ou un codage basé objet
  • H04S 3/00 - Systèmes utilisant plus de deux canaux, p.ex. systèmes quadriphoniques
  • H04S 7/00 - Dispositions pour l'indication; Dispositions pour la commande, p.ex. pour la commande de l'équilibrage

35.

CODING AND DECODING OF INTERLEAVED IMAGE DATA

      
Numéro d'application 18503711
Statut En instance
Date de dépôt 2023-11-07
Date de la première publication 2024-03-07
Propriétaire Dolby Laboratories Licensing Corporation (USA)
Inventeur(s)
  • Tourapis, Alexandros
  • Husak, Walter J.
  • Pahalawatta, Peshala V.
  • Leontaris, Athanasios

Abrégé

Sampled data is packaged in checkerboard format for encoding and decoding. The sampled data may be quincunx sampled multi-image video data (e.g., 3D video or a multi-program stream), and the data may also be divided into sub-images of each image which are then multiplexed, or interleaved, in frames of a video stream to be encoded and then decoded using a standardized video encoder. A system for viewing may utilize a standard video decoder and a formatting device that de-interleaves the decoded sub-images of each frame reformats the images for a display device. A 3D video may be encoded using a most advantageous interleaving format such that a preferred quality and compression ratio is reached. In one embodiment, the invention includes a display device that accepts data in multiple formats.

Classes IPC  ?

  • H04N 19/597 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage prédictif spécialement adapté pour l’encodage de séquences vidéo multi-vues
  • H04N 13/139 - Conversion du format, p.ex. du débit de trames ou de la taille
  • H04N 13/161 - Encodage, multiplexage ou démultiplexage de différentes composantes des signaux d’images
  • H04N 13/194 - Transmission de signaux d’images
  • H04N 19/112 - Sélection du mode de codage ou du mode de prédiction selon un mode d’affichage donné, p.ex. le mode d’affichage entrelacé ou progressif
  • H04N 19/132 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par l’élément, le paramètre ou la sélection affectés ou contrôlés par le codage adaptatif Échantillonnage, masquage ou troncature d’unités de codage, p.ex. ré-échantillonnage adaptatif, saut de trames, interpolation de trames ou masquage de coefficients haute fréquence de transformée
  • H04N 19/16 - Mode de codage attribué, c. à d. le mode de codage étant prédéfini ou présélectionné pour être utilisé ultérieurement afin de sélectionner un autre élément ou paramètre pour un mode donné d’affichage, p.ex. pour un mode d'affichage entrelacé ou progressif
  • H04N 19/176 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par l’unité de codage, c. à d. la partie structurelle ou sémantique du signal vidéo étant l’objet ou le sujet du codage adaptatif l’unité étant une zone de l'image, p.ex. un objet la zone étant un bloc, p.ex. un macrobloc
  • H04N 19/33 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant des techniques hiérarchiques, p.ex. l'échelonnage dans le domaine spatial
  • H04N 19/46 - Inclusion d’information supplémentaire dans le signal vidéo pendant le processus de compression
  • H04N 19/587 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage prédictif mettant en œuvre un sous-échantillonnage ou une interpolation temporels, p.ex. décimation ou interpolation subséquente d’images dans une séquence vidéo
  • H04N 19/60 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant un codage par transformée
  • H04N 19/61 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant un codage par transformée combiné avec un codage prédictif
  • H04N 19/85 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le pré-traitement ou le post-traitement spécialement adaptés pour la compression vidéo
  • H04N 21/2365 - Multiplexage de plusieurs flux vidéo
  • H04N 21/2383 - Codage de canal d'un flux binaire numérique, p.ex. modulation
  • H04N 21/434 - Désassemblage d'un flux multiplexé, p.ex. démultiplexage de flux audio et vidéo, extraction de données additionnelles d'un flux vidéo; Remultiplexage de flux multiplexés; Extraction ou traitement de SI; Désassemblage d'un flux élémentaire mis en paquets
  • H04N 21/438 - Interfaçage de la voie descendante du réseau de transmission provenant d'un serveur, p.ex. récupération de paquets MPEG d'un réseau IP

36.

QUANTIZATION PARAMETER SIGNALING

      
Numéro d'application 18506828
Statut En instance
Date de dépôt 2023-11-10
Date de la première publication 2024-03-07
Propriétaire Dolby Laboratories Licensing Corporation (USA)
Inventeur(s)
  • Pu, Fangjun
  • Lu, Taoran
  • Yin, Peng
  • Mccarthy, Sean Thomas

Abrégé

A quantization parameter signalling mechanism for both SDR and HDR content in video coding is described using two approaches. The first approach is to send the user-defined QpC table directly in high level syntax. This leads to more flexible and efficient QP control for future codec development and video content coding. The second approach is to signal luma and chroma QPs independently. This approach eliminates the need for QpC tables and removes the dependency of chroma quantization parameter on luma QP.

Classes IPC  ?

  • H04N 19/70 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques caractérisés par des aspects de syntaxe liés au codage vidéo, p.ex. liés aux standards de compression
  • H04N 19/172 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par l’unité de codage, c. à d. la partie structurelle ou sémantique du signal vidéo étant l’objet ou le sujet du codage adaptatif l’unité étant une zone de l'image, p.ex. un objet la zone étant une image, une trame ou un champ
  • H04N 19/186 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par l’unité de codage, c. à d. la partie structurelle ou sémantique du signal vidéo étant l’objet ou le sujet du codage adaptatif l’unité étant une couleur ou une composante de chrominance
  • H04N 19/46 - Inclusion d’information supplémentaire dans le signal vidéo pendant le processus de compression

37.

PERCEPTUALLY-BASED LOSS FUNCTIONS FOR AUDIO ENCODING AND DECODING BASED ON MACHINE LEARNING

      
Numéro d'application 18507824
Statut En instance
Date de dépôt 2023-11-13
Date de la première publication 2024-03-07
Propriétaire Dolby Laboratories Licensing Corporation (USA)
Inventeur(s)
  • Fejgin, Roy M.
  • Davidson, Grant A.
  • Wu, Chih-Wei
  • Kumar, Vivek

Abrégé

Computer-implemented methods for training a neural network, as well as for implementing audio encoders and decoders via trained neural networks, are provided. The neural network may receive an input audio signal, generate an encoded audio signal and decode the encoded audio signal. A loss function generating module may receive the decoded audio signal and a ground truth audio signal, and may generate a loss function value corresponding to the decoded audio signal. Generating the loss function value may involve applying a psychoacoustic model. The neural network may be trained based on the loss function value. The training may involve updating at least one weight of the neural network.

Classes IPC  ?

  • G10L 19/022 - Constitution de blocs, c. à d. regroupement d’échantillons temporels; Choix des fenêtres d’analyse; Facteur de recouvrement
  • G06F 3/16 - Entrée acoustique; Sortie acoustique
  • G06N 3/048 - Fonctions d’activation
  • G06N 3/084 - Rétropropagation, p.ex. suivant l’algorithme du gradient

38.

PERCEPTUAL ENHANCEMENT FOR BINAURAL AUDIO RECORDING

      
Numéro d'application 18257862
Statut En instance
Date de dépôt 2021-12-14
Date de la première publication 2024-03-07
Propriétaire Dolby Laboratories Licensing Corporation (USA)
Inventeur(s)
  • Ma, Yuanxing
  • Shuang, Zhiwei
  • Liu, Yang

Abrégé

A method of audio processing includes capturing a binaural audio signal, calculating noise reduction gains using a machine learning model, and generating a modified binaural audio signal. The method may further including performing various corrections to the audio to account for video captured by different cameras such as a front camera and a rear camera. The method may further include performing smooth switching of the binaural audio when switching between the front camera and the rear camera. In this manner, noise may be reduced in the binaural audio, and the user perception of the combined video and binaural audio may be improved.

Classes IPC  ?

  • H04R 1/10 - Ecouteurs; Leurs fixations
  • H04R 5/04 - Circuits
  • H04S 7/00 - Dispositions pour l'indication; Dispositions pour la commande, p.ex. pour la commande de l'équilibrage

39.

FRAME-RATE SCALABLE VIDEO CODING

      
Numéro d'application 18508088
Statut En instance
Date de dépôt 2023-11-13
Date de la première publication 2024-03-07
Propriétaire Dolby Laboratories Licensing Corporation (USA)
Inventeur(s)
  • Atkins, Robin
  • Yin, Peng
  • Lu, Taoran
  • Pu, Fangjun
  • Mccarthy, Sean Thomas
  • Husak, Walter J.
  • Chen, Tao
  • Su, Guan-Ming

Abrégé

Methods and systems for frame rate scalability are described. Support is provided for input and output video sequences with variable frame rate and variable shutter angle across scenes, or for input video sequences with fixed input frame rate and input shutter angle, but allowing a decoder to generate a video output at a different output frame rate and shutter angle than the corresponding input values. Techniques allowing a decoder to decode more computationally-efficiently a specific backward compatible target frame rate and shutter angle among those allowed are also presented.

Classes IPC  ?

  • H04N 19/31 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant des techniques hiérarchiques, p.ex. l'échelonnage dans le domaine temporel
  • H04N 19/172 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par l’unité de codage, c. à d. la partie structurelle ou sémantique du signal vidéo étant l’objet ou le sujet du codage adaptatif l’unité étant une zone de l'image, p.ex. un objet la zone étant une image, une trame ou un champ
  • H04N 19/187 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par l’unité de codage, c. à d. la partie structurelle ou sémantique du signal vidéo étant l’objet ou le sujet du codage adaptatif l’unité étant une couche de vidéo échelonnable
  • H04N 19/30 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant des techniques hiérarchiques, p.ex. l'échelonnage
  • H04N 19/46 - Inclusion d’information supplémentaire dans le signal vidéo pendant le processus de compression
  • H04N 19/70 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques caractérisés par des aspects de syntaxe liés au codage vidéo, p.ex. liés aux standards de compression

40.

DETERMINING DIALOG QUALITY METRICS OF A MIXED AUDIO SIGNAL

      
Numéro d'application 18259848
Statut En instance
Date de dépôt 2022-01-04
Date de la première publication 2024-02-29
Propriétaire Dolby Laboratories Licensing Corporation (USA)
Inventeur(s)
  • Sun, Jundai
  • Lu, Lie
  • Yang, Shaofan
  • Wilson, Rhonda J.
  • Breebaart, Dirk Jeroen

Abrégé

Disclosed is a method for determining one or more dialog quality metrics of a mixed audio signal comprising a dialog component and a noise component, the method comprising separating an estimated dialog component from the mixed audio signal by means of a dialog separator using a dialog separating model determined by training the dialog separator based on the one or more quality metrics; providing the estimated dialog component from the dialog separator to a quality metrics estimator; and determining the one or more quality metrics by means of the quality metrics estimator based on the mixed signal and the estimated dialog component. Further disclosed is a method for training a dialog separator, a system comprising circuitry configured to perform the method, and a non-transitory computer-readable storage medium.

Classes IPC  ?

  • G10L 25/60 - Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes spécialement adaptées pour un usage particulier pour comparaison ou différentiation pour mesurer la qualité des signaux de voix
  • G10L 21/0272 - Séparation du signal de voix

41.

RENDERING AUDIO CAPTURED WITH MULTIPLE DEVICES

      
Numéro d'application US2023030652
Numéro de publication 2024/044113
Statut Délivré - en vigueur
Date de dépôt 2023-08-21
Date de publication 2024-02-29
Propriétaire DOLBY LABORATORIES LICENSING CORPORATION (USA)
Inventeur(s)
  • Ma, Yuanxing
  • Shuang, Zhiwei
  • Liu, Yang

Abrégé

A method of audio processing includes receiving user-generated content having two audio sources, extracting audio objects and a residual signal, adjusting the audio objects and the residual signal according to the listener's head movements, and mixing the adjusted audio signals to generate a binaural audio signal. In this manner, the binaural signal adjusts according to the listener's head movements without requiring perfect audio objects.

Classes IPC  ?

  • H04S 7/00 - Dispositions pour l'indication; Dispositions pour la commande, p.ex. pour la commande de l'équilibrage

42.

SYSTEM AND METHOD FOR EVALUATION OF AN AUDIO SIGNAL PROCESSING ALGORITHM

      
Numéro d'application US2023030922
Numéro de publication 2024/044246
Statut Délivré - en vigueur
Date de dépôt 2023-08-23
Date de publication 2024-02-29
Propriétaire DOLBY LABORATORIES LICENSING CORPORATION (USA)
Inventeur(s)
  • Liu, Yifei
  • Li, Kai
  • Guo, Yanmeng

Abrégé

The present disclose related to a system (1) and method for evaluating the performance of an audio processing scheme. The system (1) comprises an acoustic feature extractor (10A, 10B), configured to receive a plurality of segment pairs, each segment pair comprising a segment (101) and a processed segment (201). The acoustic feature extractor (10A, 10B) determines an acoustic feature associated with each segment and the system (1) further comprises an event detector (11), configured to receive the at least one acoustic feature of each segment (101, 201) and determine, for each segment pair and acoustic feature, if a difference between the acoustic feature of the segment and processed segment exceeds an event threshold. The system also comprises an event analyzer (12), configured to determine a performance metric based on each segment pair associated with a difference exceeding the event threshold.

Classes IPC  ?

  • G10L 25/60 - Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes spécialement adaptées pour un usage particulier pour comparaison ou différentiation pour mesurer la qualité des signaux de voix
  • G10L 25/27 - Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par la technique d’analyse

43.

AUDIO OBJECT SEPARATION AND PROCESSING AUDIO

      
Numéro d'application US2023072443
Numéro de publication 2024/044502
Statut Délivré - en vigueur
Date de dépôt 2023-08-18
Date de publication 2024-02-29
Propriétaire DOLBY LABORATORIES LICENSING CORPORATION (USA)
Inventeur(s)
  • Sun, Jundai
  • Shuang, Zhiwei
  • Ma, Yuanxing

Abrégé

Disclosed is a method for separating audio objects in a mixed audio signal, the mixed audio signal comprising a plurality of audio objects. Further disclosed is a computer-implemented method for training a sparse audio object separation model and a method for separating a sparse audio object from a mixed audio signal, the mixed audio signal comprising at least a sparse audio object, a non-sparse audio object, and at least one further audio object. Further disclosed is a computer-implemented method for processing audio based on a signal-to-noise ratio, SNR and a computer-implemented method for processing audio based on a scene environment classification. Disclosed is a non-transitory computer-readable medium and a system configured to perform one or more of the methods.

Classes IPC  ?

  • G10L 21/028 - Séparation du signal de voix utilisant les propriétés des sources sonores
  • G10L 19/008 - Codage ou décodage du signal audio multi-canal utilisant la corrélation inter-canaux pour réduire la redondance, p.ex. stéréo combinée, codage d’intensité ou matriçage
  • G06N 3/08 - Méthodes d'apprentissage

44.

METHOD AND DEVICE FOR ENCODING AND DECODING IMAGE USING MOTION VECTOR RESOLUTION SCALING

      
Numéro d'application 18504337
Statut En instance
Date de dépôt 2023-11-08
Date de la première publication 2024-02-29
Propriétaire Dolby Laboratories Licensing Corporation (USA)
Inventeur(s)
  • Han, Jong Ki
  • Lee, Jae Yung

Abrégé

A video encoding method according to an embodiment of the present invention includes generating header information that includes information about resolutions of motion vectors of respective blocks, determined based on motion prediction for a unit image. Here, the header information includes flag information indicating whether resolutions of all motion vectors included in the unit image are integer-pixel resolutions. Further, a video decoding method according to another embodiment of the present invention includes extracting information about resolutions of motion vectors of each unit image from header information included in a target bitstream to be decoded; and a decoding unit for decoding the unit image based on the resolution information. Here, the header information includes flag information indicating whether resolutions of all motion vectors included in the unit image are integer-pixel resolutions.

Classes IPC  ?

  • H04N 19/53 - Estimation de mouvement multi-résolution; Estimation de mouvement hiérarchique
  • H04N 19/105 - Sélection de l’unité de référence pour la prédiction dans un mode de codage ou de prédiction choisi, p.ex. choix adaptatif de la position et du nombre de pixels utilisés pour la prédiction
  • H04N 19/136 - Caractéristiques ou propriétés du signal vidéo entrant
  • H04N 19/17 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par l’unité de codage, c. à d. la partie structurelle ou sémantique du signal vidéo étant l’objet ou le sujet du codage adaptatif l’unité étant une zone de l'image, p.ex. un objet
  • H04N 19/27 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage d'objets vidéo mettant en œuvre à la fois des composantes d’image synthétiques et naturelles, p.ex. codage hybride synthétique naturel [SNHC]
  • H04N 19/50 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage prédictif
  • H04N 19/51 - Estimation ou compensation du mouvement
  • H04N 19/523 - Estimation ou compensation du mouvement avec précision supérieure au sous-pixel
  • H04N 19/70 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques caractérisés par des aspects de syntaxe liés au codage vidéo, p.ex. liés aux standards de compression

45.

MULTIPLE STAGE MODULATION PROJECTOR DISPLAY SYSTEMS HAVING EFFICIENT LIGHT UTILIZATION

      
Numéro d'application 17589736
Statut En instance
Date de dépôt 2022-01-31
Date de la première publication 2024-02-29
Propriétaire DOLBY LABORATORIES LICENSING CORPORATION (USA)
Inventeur(s) Richards, Martin J.

Abrégé

Dual or multi-modulation display systems comprising a first modulator and a second modulator are disclosed. The first modulator may comprise a plurality of analog mirrors (e.g. MEMS array) and the second modulator may comprise a plurality of mirrors (e.g., DMD array). The display system may further comprise a controller that sends control signals to the first and second modulator. The display system may render highlight features within a projected image by affecting a time multiplexing scheme. In one embodiment, the first modulator may be switched on a sub-frame basis such that a desired proportion of the available light may be focused or directed onto the second modulator to form the highlight feature on a sub-frame rendering basis.

Classes IPC  ?

  • H04N 5/74 - Dispositifs de projection pour reproduction d'image, p.ex. eidophor
  • H04N 9/31 - Dispositifs de projection pour la présentation d'images en couleurs

46.

SMART DIALOGUE ENHANCEMENT BASED ON NON-ACOUSTIC MOBILE SENSOR INFORMATION

      
Numéro d'application US2023072418
Numéro de publication 2024/044499
Statut Délivré - en vigueur
Date de dépôt 2023-08-17
Date de publication 2024-02-29
Propriétaire DOLBY LABORATORIES LICENSING CORPORATION (USA)
Inventeur(s)
  • Li, Kai
  • Luo, Libin

Abrégé

Described herein is a method of performing environment-aware processing of audio data for a mobile device. In particular, the method may comprise obtaining non-acoustic sensor information of the mobile device. The method may further comprise determining scene information indicative of an environment of the mobile device based on the non-acoustic sensor information. The method may yet further comprise performing audio processing of the audio data based on the determined scene information.

Classes IPC  ?

47.

PROCESSING STREAMING DATA

      
Numéro d'application US2023072614
Numéro de publication 2024/044565
Statut Délivré - en vigueur
Date de dépôt 2023-08-22
Date de publication 2024-02-29
Propriétaire DOLBY LABORATORIES LICENSING CORPORATION (USA)
Inventeur(s)
  • Ma, Jianbo
  • Cartwright, Richard J.
  • Chandran, Deepak
  • Nosrati, Hadis

Abrégé

Disclosed herein are techniques for processing streaming data. In some embodiments, the techniques involve obtaining input data representative of a frame of streaming data. The techniques may involve identifying a query transformation, a key transformation, and a value transformation based on the input data. The techniques may involve updating a query buffer, a key buffer, and a value buffer, such that the buffers are each configured to store parameters associated with previous frames of streaming data and the frame of streaming data. The techniques may involve retrieving one or more query frames from the query buffer. The techniques may involve determining a dot product of the query frames and frames in the key buffer to determine a set of weights. The techniques may involve determining a weighted sum between the set of weights and frames in the value buffer, and utilizing the weighted sum to generate a streaming attention vector.

Classes IPC  ?

  • G10L 15/28 - Reconnaissance de la parole - Détails de structure des systèmes de reconnaissance de la parole
  • G10L 15/16 - Classement ou recherche de la parole utilisant des réseaux neuronaux artificiels
  • G06N 3/045 - Combinaisons de réseaux

48.

METHODS, DEVICES AND SYSTEMS FOR IMPLEMENTING PINNED-STATE CONNECTIONIST SEQUENTIAL CLASSIFICATION

      
Numéro d'application US2023072648
Numéro de publication 2024/044586
Statut Délivré - en vigueur
Date de dépôt 2023-08-22
Date de publication 2024-02-29
Propriétaire DOLBY LABORATORIES LICENSING CORPORATION (USA)
Inventeur(s)
  • Ma, Jianbo
  • Nosrati, Hadis

Abrégé

Some disclosed methods involve: receiving an observation sequence including a plurality of extracted features, each of which corresponds to a sequential signal of a sequence of sequential signals; determining a lattice of posterior possibilities, the lattice including a possibility of each observation sequence corresponding to one label class of a plurality of label classes; and applying a loss function to the lattice of posterior possibilities according to ground truth values, where applying the loss function involves applying both sequential information and cluster boundary information. Some methods involve updating parameters for determining the lattice according to losses determined by the loss function and performing the foregoing operations until one or more convergence criteria are met.

Classes IPC  ?

  • G06N 3/09 - Apprentissage supervisé
  • G06N 3/047 - Réseaux probabilistes ou stochastiques
  • G06N 3/049 - Réseaux neuronaux temporels, p.ex. éléments à retard, neurones oscillants ou entrées impulsionnelles

49.

Signal reshaping for high dynamic range signals

      
Numéro d'application 18385724
Numéro de brevet 11910025
Statut Délivré - en vigueur
Date de dépôt 2023-10-31
Date de la première publication 2024-02-20
Date d'octroi 2024-02-20
Propriétaire DOLBY LABORATORIES LICENSING CORPORATION (USA)
Inventeur(s)
  • Atkins, Robin
  • Yin, Peng
  • Lu, Taoran
  • Pytlarz, Jaclyn Anne

Abrégé

In a method to improve backwards compatibility when decoding high-dynamic range images coded in a wide color gamut (WCG) space which may not be compatible with legacy color spaces, hue and/or saturation values of images in an image database are computed for both a legacy color space (say, YCbCr-gamma) and a preferred WCG color space (say, IPT-PQ). Based on a cost function, a reshaped color space is computed so that the distance between the hue values in the legacy color space and rotated hue values in the preferred color space is minimized HDR images are coded in the reshaped color space. Legacy devices can still decode standard dynamic range images assuming they are coded in the legacy color space, while updated devices can use color reshaping information to decode HDR images in the preferred color space at full dynamic range.

Classes IPC  ?

  • H04N 19/87 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le pré-traitement ou le post-traitement spécialement adaptés pour la compression vidéo mettant en œuvre la détection de coupure ou de changement de scène en combinaison avec la compression vidéo
  • H04N 19/46 - Inclusion d’information supplémentaire dans le signal vidéo pendant le processus de compression
  • H04N 19/98 - Codage de plage-dynamique adaptative [ADRC]
  • H04N 19/85 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le pré-traitement ou le post-traitement spécialement adaptés pour la compression vidéo
  • H04N 1/60 - Correction ou commande des couleurs

50.

ORCHESTRATION OF ACOUSTIC DIRECT SEQUENCE SPREAD SPECTRUM SIGNALS FOR ESTIMATION OF ACOUSTIC SCENE METRICS

      
Numéro d'application 18255550
Statut En instance
Date de dépôt 2021-12-02
Date de la première publication 2024-02-15
Propriétaire Dolby Laboratories Licensing Corporation (USA)
Inventeur(s)
  • Southwell, Benjamin John
  • Gunawan, David
  • Thomas, Mark R.P.
  • Hines, Christopher Graham

Abrégé

Some methods may involve receiving a first content stream that includes first audio signals, rendering the first audio signals to produce first audio playback signals, generating first direct sequence spread spectrum (DSSS) signals, generating first modified audio playback signals by inserting the first DSSS signals into the first audio playback signals, and causing a loudspeaker system to play back the first modified audio playback signals, to generate first audio device playback sound. The method(s) may involve receiving microphone signals corresponding to at least the first audio device playback sound and to second through Nth audio device playback sound corresponding to second through Nth modified audio playback signals (including second through Nth DSSS signals) played back by second through Nth audio devices, extracting second through Nth DSSS signals from the microphone signals and estimating at least one acoustic scene metric based, at least partly, on the second through Nth DSSS signals.

Classes IPC  ?

  • H04S 7/00 - Dispositions pour l'indication; Dispositions pour la commande, p.ex. pour la commande de l'équilibrage

51.

METHOD FOR AND APPARATUS FOR DECODING/RENDERING AN AMBISONICS AUDIO SOUNDFIELD REPRESENTATION FOR AUDIO PLAYBACK USING 2D SETUPS

      
Numéro d'application 18457030
Statut En instance
Date de dépôt 2023-08-28
Date de la première publication 2024-02-15
Propriétaire Dolby Laboratories Licensing Corporation (USA)
Inventeur(s)
  • Keiler, Florian
  • Boehm, Johannes

Abrégé

Improved methods and/or apparatus for decoding an encoded audio signal in soundfield format for L loudspeakers. The method and/or apparatus can render an Ambisonics format audio signal to 2D loudspeaker setup(s) based on a rendering matrix. The rendering matrix has elements based on loudspeaker positions and wherein the rendering matrix is determined based on weighting at least an element of a first matrix with a weighting factor Improved methods and/or apparatus for decoding an encoded audio signal in soundfield format for L loudspeakers. The method and/or apparatus can render an Ambisonics format audio signal to 2D loudspeaker setup(s) based on a rendering matrix. The rendering matrix has elements based on loudspeaker positions and wherein the rendering matrix is determined based on weighting at least an element of a first matrix with a weighting factor ℊ = 1 L . Improved methods and/or apparatus for decoding an encoded audio signal in soundfield format for L loudspeakers. The method and/or apparatus can render an Ambisonics format audio signal to 2D loudspeaker setup(s) based on a rendering matrix. The rendering matrix has elements based on loudspeaker positions and wherein the rendering matrix is determined based on weighting at least an element of a first matrix with a weighting factor ℊ = 1 L . The first matrix is determined based on positions of the L loudspeakers and at least a virtual position of at least a virtual loudspeaker that is added to the positions of the L loudspeakers.

Classes IPC  ?

  • H04S 3/02 - Systèmes utilisant plus de deux canaux, p.ex. systèmes quadriphoniques du type matriciel, c. à d. dans lesquels les signaux d'entrée sont combinés algébriquement, p.ex. après avoir été déphasés les uns par rapport aux autres
  • H04S 7/00 - Dispositions pour l'indication; Dispositions pour la commande, p.ex. pour la commande de l'équilibrage

52.

BINAURAL SIGNAL POST-PROCESSING

      
Numéro d'application 18258041
Statut En instance
Date de dépôt 2021-12-16
Date de la première publication 2024-02-15
Propriétaire
  • Dolby Laboratories Licensing Corporation (USA)
  • Dolby International AB (Irlande)
Inventeur(s)
  • Breebaart, Dirk Jeroen
  • Cengarle, Giulio
  • Brown, C. Phillip

Abrégé

A method of audio processing includes performing spatial analysis on a binaural signal to estimate level differences and phase differences characteristic of a binaural filter of the binaural signal, performing object extraction on the binaural audio signal using the estimated level and phase differences to generate a left/right main component signal and a left/right residual component signal. The system may process the left/right main and left/right residual components differently using different object processing parameters for e.g. repositioning, equalization, compression, upmixing, channel remapping or storage to generate a processed binaural signal that provides an improved listening experience. Repositioning may be based on head tracking sensor data.

Classes IPC  ?

  • H04S 7/00 - Dispositions pour l'indication; Dispositions pour la commande, p.ex. pour la commande de l'équilibrage
  • H04S 3/00 - Systèmes utilisant plus de deux canaux, p.ex. systèmes quadriphoniques

53.

MULTISOURCE MEDIA DELIVERY SYSTEMS AND METHODS

      
Numéro d'application 18256987
Statut En instance
Date de dépôt 2021-12-16
Date de la première publication 2024-02-15
Propriétaire Dolby Laboratories Licensing Corporation (USA)
Inventeur(s)
  • Riedmiller, Jeffrey
  • Yu, Mingchao
  • Cloud, Jason Michael

Abrégé

A method for delivering media content to one or more clients over a distributed system is disclosed. The method may include generating a plurality of network-coded symbols from a plurality of original symbols representing a first media asset. The method may further include generating an original plurality of coded variants of the first media asset. The method may further include distributing a first coded variant of the original plurality of coded variants to a first cache on a first server device for storage in the first cache. The method may further include distributing a second coded variant of the original plurality of coded variants to a second cache on a second server device for storage in the second cache.

Classes IPC  ?

  • H04N 21/60 - Distribution sélective de contenu, p.ex. télévision interactive ou vidéo à la demande [VOD] - Détails de la communication entre serveur et client
  • H04N 21/2183 - Mémoire cache

54.

SOURCE COLOR VOLUME INFORMATION MESSAGING

      
Numéro d'application 18486697
Statut En instance
Date de dépôt 2023-10-13
Date de la première publication 2024-02-15
Propriétaire Dolby Laboratories Licensing Corporation (USA)
Inventeur(s)
  • Chen, Tao
  • Yin, Peng
  • Lu, Taoran
  • Husak, Walter J.

Abrégé

Methods are described to communicate source color volume information in a coded bitstream using SEI messaging. Such data include at least the minimum, maximum, and average luminance values in the source data plus optional data that may include the color volume x and y chromaticity coordinates for the input color primaries (e.g., red, green, and blue) of the source data, and the color x and y chromaticity coordinates for the color primaries corresponding to the minimum, average, and maximum luminance values in the source data. Messaging data signaling an active region in each picture may also be included.

Classes IPC  ?

  • H04N 19/70 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques caractérisés par des aspects de syntaxe liés au codage vidéo, p.ex. liés aux standards de compression
  • H04N 19/14 - Complexité de l’unité de codage, p.ex. activité ou estimation de présence de contours
  • H04N 19/186 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par l’unité de codage, c. à d. la partie structurelle ou sémantique du signal vidéo étant l’objet ou le sujet du codage adaptatif l’unité étant une couleur ou une composante de chrominance
  • H04N 19/20 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage d'objets vidéo

55.

METHOD FOR ENCODING AND DECODING IMAGE USING ADAPTIVE DEBLOCKING FILTERING, AND APPARATUS THEREFOR

      
Numéro d'application 18493447
Statut En instance
Date de dépôt 2023-10-24
Date de la première publication 2024-02-15
Propriétaire Dolby Laboratories Licensing Corporation (USA)
Inventeur(s)
  • Jeong, Je Chang
  • Kim, Ki Baek

Abrégé

Disclosed is an encoding/decoding method and apparatus related to adaptive deblocking filtering. There is provided an image decoding method performing adaptive filtering in inter-prediction, the method including: reconstructing, from a bitstream, an image signal including a reference block on which block matching is performed in inter-prediction of a current block to be encoded; obtaining, from the bitstream, a flag indicating whether the reference block exists within a current picture where the current block is positioned; reconstructing the current block by using the reference block; adaptively applying an in-loop filter for the reconstructed current block based on the obtained flag; and storing the current block to which the in-loop filter is or is not applied in a decoded picture buffer (DPB).

Classes IPC  ?

  • H04N 19/82 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques - Détails des opérations de filtrage spécialement adaptées à la compression vidéo, p.ex. pour l'interpolation de pixels mettant en œuvre le filtrage dans une boucle de prédiction
  • H04N 19/60 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant un codage par transformée
  • H04N 19/51 - Estimation ou compensation du mouvement
  • H04N 19/117 - Filtres, p.ex. pour le pré-traitement ou le post-traitement
  • H04N 19/50 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage prédictif
  • H04N 19/58 - Compensation de mouvement par prédiction à long terme, c. à d. que la trame de référence pour une trame courante n’est pas la plus proche temporellement
  • H04N 19/176 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par l’unité de codage, c. à d. la partie structurelle ou sémantique du signal vidéo étant l’objet ou le sujet du codage adaptatif l’unité étant une zone de l'image, p.ex. un objet la zone étant un bloc, p.ex. un macrobloc
  • H04N 19/172 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par l’unité de codage, c. à d. la partie structurelle ou sémantique du signal vidéo étant l’objet ou le sujet du codage adaptatif l’unité étant une zone de l'image, p.ex. un objet la zone étant une image, une trame ou un champ
  • H04N 19/577 - Compensation de mouvement avec interpolation de trame bidirectionnelle, p.ex. utilisation d’images B
  • H04N 19/70 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques caractérisés par des aspects de syntaxe liés au codage vidéo, p.ex. liés aux standards de compression
  • H04N 19/137 - Mouvement dans une unité de codage, p.ex. différence moyenne de champs, de trames ou de blocs
  • H04N 19/593 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage prédictif mettant en œuvre des techniques de prédiction spatiale
  • H04N 19/107 - Sélection du mode de codage ou du mode de prédiction entre codage prédictif spatial et temporel, p.ex. rafraîchissement d’image
  • H04N 19/124 - Quantification
  • H04N 19/184 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par l’unité de codage, c. à d. la partie structurelle ou sémantique du signal vidéo étant l’objet ou le sujet du codage adaptatif l’unité étant des bits, p.ex. de flux vidéo compressé
  • H04N 19/91 - Codage entropique, p.ex. codage à longueur variable ou codage arithmétique

56.

SPATIAL ENHANCEMENT FOR USER-GENERATED CONTENT

      
Numéro d'application US2023071791
Numéro de publication 2024/036113
Statut Délivré - en vigueur
Date de dépôt 2023-08-07
Date de publication 2024-02-15
Propriétaire DOLBY LABORATORIES LICENSING CORPORATION (USA)
Inventeur(s)
  • Ma, Yuanxing
  • Shuang, Zhiwei
  • Liu, Yang

Abrégé

Methods, systems, and media for enhancing audio content are provided. In some embodiments, a method for enhancing audio content involves receiving a multi-channel audio signal from a first audio capture device and a binaural audio signal from a second audio capture device. The method may further involve extracting one or more objects from the multi-channel audio signal. The method may further involve generating a spatial enhancement mask based on spatial information associated with the one or more objects. The method may further involve applying the spatial enhancement mask to the binaural audio signal to enhance spatial characteristics of the binaural audio signal to generate an enhanced binaural audio signal. The method may further involve generating output binaural audio signal based on the enhanced binaural audio signal.

Classes IPC  ?

  • H04S 7/00 - Dispositions pour l'indication; Dispositions pour la commande, p.ex. pour la commande de l'équilibrage

57.

PERSONALIZED HRTFS VIA OPTICAL CAPTURE

      
Numéro d'application 18455565
Statut En instance
Date de dépôt 2023-08-24
Date de la première publication 2024-02-08
Propriétaire Dolby Laboratories Licensing Corporation (USA)
Inventeur(s)
  • Joyner, Mcgregor Steele
  • Brandmeyer, Alex
  • Daly, Scott
  • Baker, Jeffrey Ross
  • Fanelli, Andrea
  • Crum, Poppy Anne Carrie

Abrégé

An apparatus and method of generating personalized HRTFs. The system is prepared by calculating a model for HRTFs described as the relationship between a finite example set of input data, namely anthropometric measures and demographic information for a set of individuals, and a corresponding set of output data, namely HRTFs numerically simulated using a high-resolution database of 3D scans of the same set of individuals. At the time of use, the system queries the user for their demographic information, and then from a series of images of the user, the system detects and measures various anthropometric characteristics. The system then applies the prepared model to the anthropometric and demographic data as part of generating a personalized HRTF. In this manner, the personalized HRTF can be generated with more convenience than by performing a high-resolution scan or an acoustic measurement of the user, and with less computational complexity than by numerically simulating their HRTF.

Classes IPC  ?

  • H04S 7/00 - Dispositions pour l'indication; Dispositions pour la commande, p.ex. pour la commande de l'équilibrage
  • G06T 7/11 - Découpage basé sur les zones
  • G06T 7/70 - Détermination de la position ou de l'orientation des objets ou des caméras
  • H04S 1/00 - Systèmes à deux canaux
  • G06V 40/10 - Corps d’êtres humains ou d’animaux, p.ex. occupants de véhicules automobiles ou piétons; Parties du corps, p.ex. mains
  • G06F 18/214 - Génération de motifs d'entraînement; Procédés de Bootstrapping, p.ex. ”bagging” ou ”boosting”

58.

ORCHESTRATION OF ACOUSTIC DIRECT SEQUENCE SPREAD SPECTRUM SIGNALS FOR ESTIMATION OF ACOUSTIC SCENE METRICS

      
Numéro d'application 18255499
Statut En instance
Date de dépôt 2021-12-02
Date de la première publication 2024-02-08
Propriétaire Dolby Laboratories Licensing Corporation (USA)
Inventeur(s)
  • Southwell, Benjamin John
  • Gunawan, David
  • Thomas, Mark R.P.
  • Hines, Christopher Graham

Abrégé

Some methods may involve receiving a first content stream that includes first audio signals, rendering the first audio signals to produce first audio playback signals, generating first direct sequence spread spectrum (DSSS) signals, generating first modified audio playback signals by inserting the first DSSS signals into the first audio playback signals, and causing a loudspeaker system to play back the first modified audio playback signals, to generate first audio device playback sound. The method(s) may involve receiving microphone signals corresponding to at least the first audio device playback sound and to second through Nth audio device playback sound corresponding to second through Nth modified audio playback signals (including second through Nth DSSS signals) played back by second through Nth audio devices, extracting second through Nth DSSS signals from the microphone signals and estimating at least one acoustic scene metric based, at least partly, on the second through Nth DSSS signals.

Classes IPC  ?

  • H04S 7/00 - Dispositions pour l'indication; Dispositions pour la commande, p.ex. pour la commande de l'équilibrage
  • H04R 5/02 - Dispositions spatiales ou structurelles de haut-parleurs
  • H04R 5/04 - Circuits

59.

STATISTICAL AUDIOGRAM PROCESSING

      
Numéro d'application US2023028941
Numéro de publication 2024/030337
Statut Délivré - en vigueur
Date de dépôt 2023-07-28
Date de publication 2024-02-08
Propriétaire DOLBY LABORATORIES LICENSING CORPORATION (USA)
Inventeur(s)
  • Esten, Ian Eric
  • Breebaart, Dirk Jeroen

Abrégé

Techniques and corresponding systems for estimating an audiogram for a user of a media playback device including obtaining user hearing threshold data for the user, sample hearing threshold data, at least one of sample calibration data and sample noise data, and determining an estimate of the audiogram for the user based on such data. Related techniques for estimating calibration data for a media playback device, as well as corresponding computing apparatus, computer programs, and computer-readable storage media are also described.

Classes IPC  ?

  • A61B 5/12 - Audiométrie
  • A61B 5/00 - Mesure servant à établir un diagnostic ; Identification des individus

60.

DEEP LEARNING BASED MITIGATION OF AUDIO ARTIFACTS

      
Numéro d'application US2023028943
Numéro de publication 2024/030338
Statut Délivré - en vigueur
Date de dépôt 2023-07-28
Date de publication 2024-02-08
Propriétaire DOLBY LABORATORIES LICENSING CORPORATION (USA)
Inventeur(s)
  • Dai, Jia
  • Li, Kai
  • Liu, Xiaoyu

Abrégé

A system is programmed to build a machine learning model that comprises a series of masking blocks. Each masking block receives a certain feature vector of an audio segment. Each masking block comprises a first component that generates a first mask for extracting clean speech and a second component that generates a second mask for extracting residual speech masked by the first mask. Each masking block also generates a specific feature vector based on the first mask and the second mask, which becomes the certain feature vector for the next masking block. The second component, which may comprise a gated recurrent unit layer, is computationally less complex than the first component, which may comprise multiple convolutional layers. Furthermore, the system is programmed to receive an input feature vector of an input audio segment and execute the machine learning model to obtain an output feature vector of an output audio segment.

Classes IPC  ?

61.

AUDIO CONTENT IDENTIFICATION

      
Numéro d'application 18022125
Statut En instance
Date de dépôt 2021-08-18
Date de la première publication 2024-02-01
Propriétaire Dolby Laboratories Licensing Corporation (USA)
Inventeur(s)
  • Wang, Guiping
  • Lu, Lie

Abrégé

A method of audio content identification includes using a two-stage classifier. The first stage includes previously-existing classifiers and the second stage includes a new classifier. The outputs of the first and second stages calculated over different time periods are combined to generate a steering signal. The final classification results from a combination of the steering signal and the outputs of the first and second stages. In this manner, a new classifier may be added without disrupting existing classifiers.

Classes IPC  ?

  • G10L 25/81 - Détection de la présence ou de l’absence de signaux de voix pour différencier la parole de la musique
  • G10L 15/08 - Classement ou recherche de la parole
  • G10L 15/02 - Extraction de caractéristiques pour la reconnaissance de la parole; Sélection d'unités de reconnaissance 

62.

ACOUSTIC FEEDBACK MANAGEMENT IN REAL-TIME AUDIO COMMUNICATION

      
Numéro d'application 18258302
Statut En instance
Date de dépôt 2021-12-22
Date de la première publication 2024-02-01
Propriétaire Dolby Laboratories Licensing Corporation (USA)
Inventeur(s)
  • Fang, Qianqian
  • Li, Kai
  • Guo, Yanmeng
  • Huang, Wei
  • Liu, Yang

Abrégé

Disclosed is a method for managing acoustic feedback in real-time audio communications in a communications system, the method comprising determining, by means of a detection module, whether a first communication device is in loudspeaker mode, whether the first communication device is in real-time audio communications with a second communication, and whether the first communication device and the second communication device are in a same acoustic space. Upon determining that this is the case a request signal for requesting one or more measures against acoustic feedback is provided to a mitigation module. Further disclosed are a device and a system configured to perform the method, a non-transitory computer-readable medium, an encoder and a decoder.

Classes IPC  ?

  • H04M 9/08 - Systèmes téléphoniques à haut-parleur à double sens comportant des moyens pour conditionner le signal, p.ex. pour supprimer les échos dans l'une ou les deux directions du trafic 
  • H04M 3/40 - Applications des amplificateurs de parole
  • H04R 3/02 - Circuits pour transducteurs pour empêcher la réaction acoustique

63.

VOLUME LEVELER CONTROLLER AND CONTROLLING METHOD

      
Numéro d'application 18356044
Statut En instance
Date de dépôt 2023-07-20
Date de la première publication 2024-02-01
Propriétaire DOLBY LABORATORIES LICENSING CORPORATION (USA)
Inventeur(s)
  • Wang, Jun
  • Lu, Lie
  • Seefeldt, Alan J.

Abrégé

Volume leveler controller and controlling method are disclosed. In one embodiment, A volume leveler controller includes an audio content classifier for identifying the content type of an audio signal in real time; and an adjusting unit for adjusting a volume leveler in a continuous manner based on the content type as identified. The adjusting unit may configured to positively correlate the dynamic gain of the volume leveler with informative content types of the audio signal, and negatively correlate the dynamic gain of the volume leveler with interfering content types of the audio signal.

Classes IPC  ?

  • H03G 7/00 - Compression ou expansion de volume dans les amplificateurs
  • H03G 3/30 - Commande automatique dans des amplificateurs comportant des dispositifs semi-conducteurs
  • H03G 3/32 - Commande automatique dans des amplificateurs comportant des dispositifs semi-conducteurs le réglage dépendant du niveau de bruit ambiant ou du niveau sonore ambiant
  • H03G 5/16 - Commande automatique
  • G10L 25/30 - Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par la technique d’analyse utilisant des réseaux neuronaux
  • G10L 25/51 - Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes spécialement adaptées pour un usage particulier pour comparaison ou différentiation
  • G10L 21/0364 - Amélioration de l'intelligibilité de la parole, p.ex. réduction de bruit ou annulation d'écho en changeant l’amplitude pour améliorer l'intelligibilité

64.

METHOD AND DEVICE FOR DECODING A HIGHER-ORDER AMBISONICS (HOA) REPRESENTATION OF AN AUDIO SOUNDFIELD

      
Numéro d'application 18359198
Statut En instance
Date de dépôt 2023-07-26
Date de la première publication 2024-02-01
Propriétaire Dolby Laboratories Licensing Corporation (USA)
Inventeur(s)
  • Boehm, Johannes
  • Keiler, Florian

Abrégé

The invention discloses rendering sound field signals, such as Higher-Order Ambisonics (HOA), for arbitrary loudspeaker setups, where the rendering results in highly improved localization properties and is energy preserving. This is obtained by rendering an audio sound field representation for arbitrary spatial loudspeaker setups and/or by a a decoder that decodes based on a decode matrix (D). The decode matrix (D) is based on smoothing and scaling of a first decode matrix {circumflex over (D)} with smoothing coefficients. The first decode matrix {circumflex over (D)} is based on a mix matrix G and a mode matrix {tilde over (ψ)}, where the mix matrix G was determined based on L speakers and positions of a spherical modelling grid related to a HOA order N, and the mode matrix {tilde over (ψ)} was determined based on the spherical modelling grid and the HOA order N.

Classes IPC  ?

  • H04S 7/00 - Dispositions pour l'indication; Dispositions pour la commande, p.ex. pour la commande de l'équilibrage
  • H04S 3/00 - Systèmes utilisant plus de deux canaux, p.ex. systèmes quadriphoniques

65.

ACOUSTIC ENVIRONMENT SIMULATION

      
Numéro d'application 18366385
Statut En instance
Date de dépôt 2023-08-07
Date de la première publication 2024-02-01
Propriétaire Dolby Laboratories Licensing Corporation (USA)
Inventeur(s) Breebaart, Dirk Jeroen

Abrégé

Encoding/decoding an audio signal having one or more audio components, wherein each audio component is associated with a spatial location. A first audio signal presentation (z) of the audio components, a first set of transform parameters (w(f)), and signal level data (β2) are encoded and transmitted to the decoder. The decoder uses the first set of transform parameters (w(f)) to form a reconstructed simulation input signal intended for an acoustic environment simulation, and applies a signal level modification (α) to the reconstructed simulation input signal. The signal level modification is based on the signal level data (β2) and data (p2) related to the acoustic environment simulation. The attenuated reconstructed simulation input signal is then processed in an acoustic environment simulator. With this process, the decoder does not need to determine the signal level of the simulation input signal, thereby reducing processing load.

Classes IPC  ?

  • G10L 19/008 - Codage ou décodage du signal audio multi-canal utilisant la corrélation inter-canaux pour réduire la redondance, p.ex. stéréo combinée, codage d’intensité ou matriçage
  • G10L 19/012 - Codage du bruit de confort ou du silence
  • G10L 19/00 - Techniques d'analyse ou de synthèse de la parole ou des signaux audio pour la réduction de la redondance, p.ex. dans les vocodeurs; Codage ou décodage de la parole ou des signaux audio utilisant les modèles source-filtre ou l’analyse psychoacoustique
  • G10L 19/02 - Techniques d'analyse ou de synthèse de la parole ou des signaux audio pour la réduction de la redondance, p.ex. dans les vocodeurs; Codage ou décodage de la parole ou des signaux audio utilisant les modèles source-filtre ou l’analyse psychoacoustique utilisant l'analyse spectrale, p.ex. vocodeurs à transformée ou vocodeurs à sous-bandes

66.

SPATIAL AUDIO RENDERING ADAPTIVE TO SIGNAL LEVEL AND LOUDSPEAKER PLAYBACK LIMIT THRESHOLDS

      
Numéro d'application US2023028378
Numéro de publication 2024/025803
Statut Délivré - en vigueur
Date de dépôt 2023-07-21
Date de publication 2024-02-01
Propriétaire DOLBY LABORATORIES LICENSING CORPORATION (USA)
Inventeur(s)
  • Seefeldt, Alan J.
  • Lando, Joshua B.
  • Port, Timothy Alan

Abrégé

Rendering audio signals may involve a mapping for each audio signal to the loudspeaker signals computed as a function of an audio signal's intended perceived spatial position, physical positions associated with the loudspeakers and a time- and frequency-varying representation of loudspeaker signal level relative to a maximum playback limit of each loudspeaker. Each mapping may be computed to approximately achieve the intended perceived spatial position of an associated audio signal when the loudspeaker signals are played back. A representation of loudspeaker signal level relative to a maximum playback limit may be computed for each audio signal. The mapping of an audio signal into a particular loudspeaker signal may be reduced as loudspeaker signal level relative to a maximum playback limit increases above a threshold, while the mapping may be increased into one or more other loudspeakers for which the maximum playback limits are less than a threshold.

Classes IPC  ?

  • H04S 7/00 - Dispositions pour l'indication; Dispositions pour la commande, p.ex. pour la commande de l'équilibrage

67.

METHODS, APPARATUS AND SYSTEMS FOR POSITION-BASED GAIN ADJUSTMENT OF OBJECT-BASED AUDIO

      
Numéro d'application 18353063
Statut En instance
Date de dépôt 2023-07-15
Date de la première publication 2024-01-25
Propriétaire
  • DOLBY LABORATORIES LICENSING CORPORATION (USA)
  • DOLBY INTERNATIONAL AB (Irlande)
Inventeur(s)
  • Tsingos, Nicolas R.
  • Mcgrath, David S.
  • Sanchez, Freddie
  • Mateos Sole, Antonio

Abrégé

The positions of a plurality of speakers at a media consumption site are determined. Audio information in an object-based format is received. Gain adjustment value for a sound content portion in the object-based format may be determined based on the position of the sound content portion and the positions of the plurality of speakers. Audio information in a ring-based channel format is received. Gain adjustment value for each ring-based channel in a set of ring-based channels may be determined based on the ring to which the ring-based channel belongs and the positions of the speakers at a media consumption site.

Classes IPC  ?

  • H04S 7/00 - Dispositions pour l'indication; Dispositions pour la commande, p.ex. pour la commande de l'équilibrage

68.

FRAME-RATE SCALABLE VIDEO CODING

      
Numéro d'application 18477511
Statut En instance
Date de dépôt 2023-09-28
Date de la première publication 2024-01-25
Propriétaire Dolby Laboratories Licensing Corporation (USA)
Inventeur(s)
  • Atkins, Robin
  • Yin, Peng
  • Lu, Taoran
  • Pu, Fangjun
  • Mccarthy, Sean Thomas
  • Husak, Walter J.
  • Chen, Tao
  • Su, Guan-Ming

Abrégé

Methods and systems for frame rate scalability are described. Support is provided for input and output video sequences with variable frame rate and variable shutter angle across scenes, or for input video sequences with fixed input frame rate and input shutter angle, but allowing a decoder to generate a video output at a different output frame rate and shutter angle than the corresponding input values. Techniques allowing a decoder to decode more computationally-efficiently a specific backward compatible target frame rate and shutter angle among those allowed are also presented.

Classes IPC  ?

  • H04N 19/31 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant des techniques hiérarchiques, p.ex. l'échelonnage dans le domaine temporel
  • H04N 19/187 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par l’unité de codage, c. à d. la partie structurelle ou sémantique du signal vidéo étant l’objet ou le sujet du codage adaptatif l’unité étant une couche de vidéo échelonnable
  • H04N 19/172 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par l’unité de codage, c. à d. la partie structurelle ou sémantique du signal vidéo étant l’objet ou le sujet du codage adaptatif l’unité étant une zone de l'image, p.ex. un objet la zone étant une image, une trame ou un champ
  • H04N 19/30 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant des techniques hiérarchiques, p.ex. l'échelonnage
  • H04N 19/46 - Inclusion d’information supplémentaire dans le signal vidéo pendant le processus de compression
  • H04N 19/70 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques caractérisés par des aspects de syntaxe liés au codage vidéo, p.ex. liés aux standards de compression

69.

MULTIPLE-INTENT COMPOSITE IMAGE ENCODING AND RENDERING

      
Numéro d'application US2023070361
Numéro de publication 2024/020356
Statut Délivré - en vigueur
Date de dépôt 2023-07-18
Date de publication 2024-01-25
Propriétaire DOLBY LABORATORIES LICENSING CORPORATION (USA)
Inventeur(s)
  • Atkins, Robin
  • Pytlarz, Jaclyn Anne
  • Zuena, Jake William

Abrégé

Techniques for multiple-intent composite image encoding and rendering are disclosed. The techniques can include obtaining a set of constituent images for a composite image, determining a common rendering intent to be applied to the set of constituent images, adjusting one or more of the set of constituent images according to the common rendering intent, resulting in an adjusted set of constituent images, creating the composite image based on the adjusted set of constituent images, generating metadata characterizing the common rendering intent, and encoding the composite image and the metadata to create an encoded multiple-intent composite image.

Classes IPC  ?

  • H04N 19/46 - Inclusion d’information supplémentaire dans le signal vidéo pendant le processus de compression
  • H04N 19/597 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage prédictif spécialement adapté pour l’encodage de séquences vidéo multi-vues
  • H04N 19/85 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le pré-traitement ou le post-traitement spécialement adaptés pour la compression vidéo
  • G06T 11/60 - Edition de figures et de texte; Combinaison de figures ou de texte

70.

PROCESSING OF EXTENDED DIMENSION LIGHT FIELD IMAGES

      
Numéro d'application 18255583
Statut En instance
Date de dépôt 2021-12-02
Date de la première publication 2024-01-25
Propriétaire DOLBY LABORATORIES LICENSING CORPORATION (USA)
Inventeur(s) Atkins, Robin

Abrégé

In one embodiment, methods, media, and systems process and display light field images using a view function that is based on pixel locations in the image and on the viewer's distance (observer's Z position) from the display. The view function can be an angular view function that specifies different angular views for different pixels in the light field image based on the inputs that can include: the x or y pixel location in the image, the viewer's distance from the display, and the viewer's angle relative to the display. In one embodiment, light field metadata, such as angular range metadata and/or angular offset metadata can be used to process and display the image. In one embodiment, color volume mapping metadata can be used to adjust color volume mapping based on the determined angular views; and the color volume mapping metadata can also be adjusted based on angular offset metadata.

Classes IPC  ?

  • H04N 13/117 - Transformation de signaux d’images correspondant à des points de vue virtuels, p.ex. interpolation spatiale de l’image les positions des points de vue virtuels étant choisies par les spectateurs ou déterminées par suivi du spectateur
  • H04N 13/366 - Suivi des spectateurs
  • H04N 13/388 - Affichages volumétriques, c. à d. systèmes où l’image est réalisée à partir d’éléments répartis dans un volume
  • H04N 13/232 - Générateurs de signaux d’images utilisant des caméras à images stéréoscopiques utilisant un seul capteur d’images 2D utilisant des lentilles du type œil de mouche, p.ex. dispositions de lentilles circulaires
  • H04N 13/178 - Métadonnées, p.ex. informations sur la disparité
  • H04N 23/957 - Caméras ou modules de caméras à champ lumineux ou plénoptiques

71.

COLOR-GRADING CONTENT BASED ON SIMILARITY TO EXEMPLARS

      
Numéro d'application US2023070581
Numéro de publication 2024/020482
Statut Délivré - en vigueur
Date de dépôt 2023-07-20
Date de publication 2024-01-25
Propriétaire DOLBY LABORATORIES LICENSING CORPORATION (USA)
Inventeur(s) Ward, Gregory John

Abrégé

Systems and methods for color grading of images and video based on similarity to exemplars. In preparation for color-grading new content, exemplar frames related to the expected new content may be obtained and color grading parameters for the exemplar frames may be obtained. To color grade the new content as it is created or received, similarities between frames of the new content and the exemplar frames may be determined. The similarities between frames of the new content and the exemplar frames may be determined may be combined with the obtained color-grading parameters from the exemplar frames to determine suitable color-grading parameters to apply to the new content. The new content may then be color-graded using the determined color-grading parameters.

Classes IPC  ?

  • H04N 9/64 - Circuits pour le traitement de signaux de couleur
  • H04N 9/77 - Circuits pour le traitement l'un par rapport à l'autre des signaux de luminance et de chrominance, p.ex. ajustement de la phase du signal de luminance par rapport au signal de couleur, correction différentielle du gain ou de la phase

72.

Alias cancelling during audio coding mode transitions

      
Numéro d'application 17589228
Numéro de brevet RE049813
Statut Délivré - en vigueur
Date de dépôt 2022-01-31
Date de la première publication 2024-01-23
Date d'octroi 2024-01-23
Propriétaire Dolby Laboratories Licensing Corporation (USA)
Inventeur(s)
  • Oh, Hyen-O
  • Lee, Chang Heon
  • Kang, Hong-Goo
  • Song, Jeungook

Abrégé

An apparatus for processing an audio signal and method thereof are disclosed. The present invention includes receiving, by an audio processing apparatus, an audio signal including a first data of a first block encoded with rectangular coding scheme and a second data of a second block encoded with non-rectangular coding scheme; receiving a compensation signal corresponding to the second block; estimating a prediction of an aliasing part using the first data; and, obtaining a reconstructed signal for the second block based on the second data, the compensation signal and the prediction of aliasing part.

Classes IPC  ?

  • G10L 19/00 - Techniques d'analyse ou de synthèse de la parole ou des signaux audio pour la réduction de la redondance, p.ex. dans les vocodeurs; Codage ou décodage de la parole ou des signaux audio utilisant les modèles source-filtre ou l’analyse psychoacoustique
  • G10L 25/45 - Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par le type de fenêtre d’analyse
  • G10L 21/00 - Traitement du signal de parole ou de voix pour produire un autre signal audible ou non audible, p.ex. visuel ou tactile, afin de modifier sa qualité ou son intelligibilité
  • G10L 19/04 - Techniques d'analyse ou de synthèse de la parole ou des signaux audio pour la réduction de la redondance, p.ex. dans les vocodeurs; Codage ou décodage de la parole ou des signaux audio utilisant les modèles source-filtre ou l’analyse psychoacoustique utilisant des techniques de prédiction
  • G10L 19/022 - Constitution de blocs, c. à d. regroupement d’échantillons temporels; Choix des fenêtres d’analyse; Facteur de recouvrement
  • G10L 19/18 - Vocodeurs utilisant des modes multiples
  • G10L 19/005 - Correction d’erreurs induites par le canal de transmission, lorsqu’elles sont liées à l’algorithme de codage

73.

AUTOMATIC GENERATION AND SELECTION OF TARGET PROFILES FOR DYNAMIC EQUALIZATION OF AUDIO CONTENT

      
Numéro d'application 18253850
Statut En instance
Date de dépôt 2021-11-18
Date de la première publication 2024-01-18
Propriétaire
  • Dolby Laboratories Licensing Corporation (USA)
  • DOLBY INTERNATIONAL AB (Irlande)
Inventeur(s)
  • Cengarle, Giulio
  • Engel, Nicholas Laurence
  • Scannell, Patrick Winfrey
  • Scaini, Davide

Abrégé

In an embodiment, a method comprises: filtering reference audio content items to separate the reference audio content items into different frequency bands; for each frequency band, extracting a first feature vector from at least a portion of each of the reference audio content items, wherein the first feature vector includes at least one audio characteristic of the reference audio content items; obtaining at least one semantic label from at least a portion of each of the reference audio content items; obtaining a second feature vector consisting of the first feature vectors per frequency band and the at least one semantic label; generating, based on the second feature vector, cluster feature vectors representing centroids of clusters; separating the reference audio content items according to the cluster feature vectors; and computing an average target profile for each cluster based on the reference audio content items in the cluster.

Classes IPC  ?

  • H03G 5/00 - Commande de tonalité ou commande de largeur de bande dans les amplificateurs
  • H04R 3/04 - Circuits pour transducteurs pour corriger la fréquence de réponse
  • G10L 25/21 - Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par le type de paramètres extraits les paramètres extraits étant l’information sur la puissance
  • G10L 25/18 - Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par le type de paramètres extraits les paramètres extraits étant l’information spectrale de chaque sous-bande
  • G10L 15/18 - Classement ou recherche de la parole utilisant une modélisation du langage naturel

74.

SYSTEM FOR MAINTAINING REVERSIBLE DYNAMIC RANGE CONTROL INFORMATION ASSOCIATED WITH PARAMETRIC AUDIO CODERS

      
Numéro d'application 18355168
Statut En instance
Date de dépôt 2023-07-19
Date de la première publication 2024-01-18
Propriétaire
  • DOLBY LABORATORIES LICENSING CORPORATION (USA)
  • DOLBY INTERNATIONAL AB (Irlande)
Inventeur(s)
  • Riedmiller, Jeffrey
  • Roeden, Karl J.
  • Kjoerling, Kristofer
  • Purnhagen, Heiko
  • Melkote, Vinay
  • Sehlstrom, Leif

Abrégé

On the basis of a bitstream (P), an n-channel audio signal (X) is reconstructed by deriving an m-channel core signal (Y) and multichannel coding parameters (a) from the bitstream, where 1≤m

Classes IPC  ?

  • E21B 33/138 - Plâtrage de la paroi du trou de forage; Injections dans la formation
  • E21B 41/00 - Matériel ou accessoires non couverts par les groupes
  • E21B 21/00 - Procédés ou appareils pour nettoyer les trous de forage par jet de fluide, p.ex. en utilisant l'air d'échappement du moteur
  • G10L 19/008 - Codage ou décodage du signal audio multi-canal utilisant la corrélation inter-canaux pour réduire la redondance, p.ex. stéréo combinée, codage d’intensité ou matriçage
  • G10L 19/16 - Architecture de vocodeur
  • G10L 19/18 - Vocodeurs utilisant des modes multiples
  • G10L 19/24 - Codecs à débit variable, p.ex. pour générer différentes qualités en utilisant une représentation évolutive comme le codage hiérarchique ou le codage par couches

75.

AUTOMATIC LOCALIZATION OF AUDIO DEVICES

      
Numéro d'application 18255554
Statut En instance
Date de dépôt 2021-12-02
Date de la première publication 2024-01-18
Propriétaire
  • Dolby Laboratories Licensing Corporation (USA)
  • Dolby International AB (Irlande)
Inventeur(s)
  • Arteaga, Daniel
  • Scaini, Davide
  • Thomas, Mark R.P.
  • Bruni, Avery
  • Townsend, Olha Michelle

Abrégé

A method may involve: receiving direction of arrival (DOA) data corresponding to sound emitted by at least a first smart audio device of the audio environment that includes a first audio transmitter and a first audio receiver, the DOA data corresponding to sound received by at least a second smart audio device of the audio environment that includes a second audio transmitter and a second audio receiver, the DOA data corresponding to sound emitted by at least the second smart audio device and received by at least the first smart audio device; receiving one or more configuration parameters corresponding to the audio environment, to one or more audio devices, or both; and minimizing a cost function based at least in part on the DOA data and the configuration parameter(s), to estimate a position and an orientation of at least the first smart audio device and the second smart audio device.

Classes IPC  ?

  • H04S 7/00 - Dispositions pour l'indication; Dispositions pour la commande, p.ex. pour la commande de l'équilibrage
  • H04R 5/02 - Dispositions spatiales ou structurelles de haut-parleurs
  • H04R 3/00 - Circuits pour transducteurs

76.

PROCESSING OF MICROPHONE SIGNALS FOR SPATIAL PLAYBACK

      
Numéro d'application 18352197
Statut En instance
Date de dépôt 2023-07-13
Date de la première publication 2024-01-11
Propriétaire DOLBY LABORATORIES LICENSING CORPORATION (USA)
Inventeur(s) Mcgrath, David S.

Abrégé

Disclosed are methods and systems which convert a multi-microphone input signal to a multichannel output signal making use of a time- and frequency-varying matrix. For each time and frequency tile, the matrix is derived as a function of a dominant direction of arrival and a steering strength parameter. Likewise, the dominant direction and steering strength parameter are derived from characteristics of the multi-microphone signals, where those characteristics include values representative of the inter-channel amplitude and group-delay differences.

Classes IPC  ?

  • H04R 3/00 - Circuits pour transducteurs
  • H04R 1/40 - Dispositions pour obtenir la fréquence désirée ou les caractéristiques directionnelles pour obtenir la caractéristique directionnelle désirée uniquement en combinant plusieurs transducteurs identiques
  • H04R 5/04 - Circuits

77.

LOOP FILTERING USING NEURAL NETWORKS

      
Numéro d'application US2023026238
Numéro de publication 2024/010710
Statut Délivré - en vigueur
Date de dépôt 2023-06-26
Date de publication 2024-01-11
Propriétaire DOLBY LABORATORIES LICENSING CORPORATION (USA)
Inventeur(s)
  • Shingala, Jay Nitin
  • Kadaramandalgi, Shireesh Vaman
  • Shyam, Ajay
  • Shao, Tong
  • Arora, Arjun
  • Yin, Peng
  • Badya, Siddarth Prakash
  • Suneja, Ajat

Abrégé

Methods, systems, bitstream syntax, and fixed-point implementations are described for loop filtering using neural networks in image and video processing. Given an input image, a hybrid luma-chroma filter is proposed, wherein luma and chroma components are first processed by a first neural network and the output of the first network is subsequently processed by separate luma and chroma subnetworks. Finally, the outputs of the separate luma and chroma subnetworks are concatenated to generate the filtered output of the input image. Computational efficient methods using CP-decomposition are also described. Methods indicating the position of the neural-net loop filter relatively to other filters, such as the adaptive loop filter (ALF) are also discussed.

Classes IPC  ?

  • H04N 19/82 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques - Détails des opérations de filtrage spécialement adaptées à la compression vidéo, p.ex. pour l'interpolation de pixels mettant en œuvre le filtrage dans une boucle de prédiction

78.

ADAPTIVE NOISE ESTIMATION

      
Numéro d'application 18044777
Statut En instance
Date de dépôt 2021-09-21
Date de la première publication 2024-01-11
Propriétaire
  • Dolby Laboratories Licensing Corporation (USA)
  • DOLBY INTERNATIONAL AB (Irlande)
Inventeur(s)
  • Scaini, Davide
  • Yeh, Chunghsin
  • Cengarle, Giulio
  • De Burgh, Mark David

Abrégé

In some embodiments, a method, comprises: dividing, using at least one processor, an audio input into speech and non-speech segments; for each frame in each non-speech segment, estimating, using the at least one processor, a time-varying noise spectrum of the non-speech segment; for each frame in each speech segment, estimating, using the at least one processor, speech spectrum of the speech segment; for each frame in each speech segment, identifying one or more non-speech frequency components in the speech spectrum; comparing the one or more non-speech frequency components with one or more corresponding frequency components in a plurality of estimated noise spectra and selecting the estimated noise spectrum from the plurality of estimated noise spectra based on a result of the comparing.

Classes IPC  ?

  • G10L 21/0232 - Traitement dans le domaine fréquentiel
  • G10L 21/028 - Séparation du signal de voix utilisant les propriétés des sources sonores
  • G10L 25/18 - Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par le type de paramètres extraits les paramètres extraits étant l’information spectrale de chaque sous-bande
  • G10L 25/84 - Détection de la présence ou de l’absence de signaux de voix pour différencier la parole du bruit
  • G10L 21/034 - Réglage automatique
  • G10L 21/0364 - Amélioration de l'intelligibilité de la parole, p.ex. réduction de bruit ou annulation d'écho en changeant l’amplitude pour améliorer l'intelligibilité
  • G10L 25/21 - Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par le type de paramètres extraits les paramètres extraits étant l’information sur la puissance

79.

ROTATION OF SOUND COMPONENTS FOR ORIENTATION-DEPENDENT CODING SCHEMES

      
Numéro d'application 18255232
Statut En instance
Date de dépôt 2021-12-02
Date de la première publication 2024-01-11
Propriétaire
  • Dolby Laboratories Licensing Corporation (USA)
  • DOLBY INTERNATIONAL AB (Irlande)
Inventeur(s)
  • Bruhn, Stefan
  • Mundt, Harald
  • Mcgrath, David S.
  • Brown, Stefanie

Abrégé

Method for encoding scene-based audio is provided. In some implementations, the method involves determining, by an encoder, a spatial direction of a dominant sound component in a frame of an input audio signal. In some implementations, the method involves determining rotation parameters based on the determined spatial direction and a direction preference of a coding scheme to be used to encode the input audio signal. In some implementations, the method involves rotating sound components of the frame based on the rotation parameters such that, after being rotated, the dominant sound component has a spatial direction that aligns with the direction preference of the coding scheme. In some implementations, the method involves encoding the rotated sound components of the frame of the input audio signal using the coding scheme in connection with an indication of the rotation parameters or an indication of the spatial direction of the dominant sound component.

Classes IPC  ?

  • G10L 19/008 - Codage ou décodage du signal audio multi-canal utilisant la corrélation inter-canaux pour réduire la redondance, p.ex. stéréo combinée, codage d’intensité ou matriçage
  • G10L 19/002 - Allocation dynamique de bit
  • G10L 19/032 - Quantification ou dé-quantification de composantes spectrales

80.

FRAME-RATE SCALABLE VIDEO CODING

      
Numéro d'application 18334306
Statut En instance
Date de dépôt 2023-06-13
Date de la première publication 2024-01-11
Propriétaire DOLBY LABORATORIES LICENSING CORPORATION (USA)
Inventeur(s)
  • Atkins, Robin
  • Yin, Peng
  • Lu, Taoran
  • Pu, Fangjun
  • Mccarthy, Sean Thomas
  • Husak, Walter J.
  • Chen, Tao
  • Su, Guan-Ming

Abrégé

Methods and systems for frame rate scalability are described. Support is provided for input and output video sequences with variable frame rate and variable shutter angle across scenes, or for input video sequences with fixed input frame rate and input shutter angle, but allowing a decoder to generate a video output at a different output frame rate and shutter angle than the corresponding input values. Techniques allowing a decoder to decode more computationally-efficiently a specific backward compatible target frame rate and shutter angle among those allowed are also presented.

Classes IPC  ?

  • H04N 19/31 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant des techniques hiérarchiques, p.ex. l'échelonnage dans le domaine temporel
  • H04N 19/187 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par l’unité de codage, c. à d. la partie structurelle ou sémantique du signal vidéo étant l’objet ou le sujet du codage adaptatif l’unité étant une couche de vidéo échelonnable
  • H04N 19/172 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par l’unité de codage, c. à d. la partie structurelle ou sémantique du signal vidéo étant l’objet ou le sujet du codage adaptatif l’unité étant une zone de l'image, p.ex. un objet la zone étant une image, une trame ou un champ
  • H04N 19/30 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant des techniques hiérarchiques, p.ex. l'échelonnage
  • H04N 19/46 - Inclusion d’information supplémentaire dans le signal vidéo pendant le processus de compression
  • H04N 19/70 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques caractérisés par des aspects de syntaxe liés au codage vidéo, p.ex. liés aux standards de compression

81.

METHODS AND DEVICES FOR ENCODING AND/OR DECODING IMMERSIVE AUDIO SIGNALS

      
Numéro d'application 18349427
Statut En instance
Date de dépôt 2023-07-10
Date de la première publication 2024-01-04
Propriétaire
  • DOLBY LABORATORIES LICENSING CORPORATION (USA)
  • DOLBY INTERNATIONAL AB (Irlande)
Inventeur(s)
  • Mcgrath, David S.
  • Eckert, Michael
  • Purnhagen, Heiko
  • Bruhn, Stefan

Abrégé

The present document describes a method (700) for encoding a multi-channel input signal (201). The method (700) comprises determining (701) a plurality of downmix channel signals (203) from the multi-channel input signal (201) and performing (702) energy compaction of the plurality of downmix channel signals (203) to provide a plurality of compacted channel signals (404). Furthermore, the method (700) comprises determining (703) joint coding metadata (205) based on the plurality of compacted channel signals (404) and based on the multi-channel input signal (201), wherein the joint coding metadata (205) is such that it allows upmixing of the plurality of compacted channel signals (404) to an approximation of the multi-channel input signal (201). In addition, the method (700) comprises encoding (704) the plurality of compacted channel signals (404) and the joint coding metadata (205).

Classes IPC  ?

  • G10L 19/16 - Architecture de vocodeur
  • G10L 19/008 - Codage ou décodage du signal audio multi-canal utilisant la corrélation inter-canaux pour réduire la redondance, p.ex. stéréo combinée, codage d’intensité ou matriçage
  • G10L 19/18 - Vocodeurs utilisant des modes multiples

82.

WRAPPED RESHAPING FOR CODEWORD AUGMENTATION WITH NEIGHBORHOOD CONSISTENCY

      
Numéro d'application 18252357
Statut En instance
Date de dépôt 2021-11-10
Date de la première publication 2024-01-04
Propriétaire Dolby Laboratories Licensing Corporation (USA)
Inventeur(s)
  • Horvath, Janos
  • Kadu, Harshad
  • Su, Guan-Ming

Abrégé

An input image of a first bit depth in an input domain is received. Forward reshaping operations are performed on the input image to generate a forward reshaped image of a second bit depth in a reshaping domain. An image container containing image data derived from the forward reshaped image is encoded into an output video signal of the second bit depth.

Classes IPC  ?

  • H04N 19/98 - Codage de plage-dynamique adaptative [ADRC]
  • H04N 19/105 - Sélection de l’unité de référence pour la prédiction dans un mode de codage ou de prédiction choisi, p.ex. choix adaptatif de la position et du nombre de pixels utilisés pour la prédiction
  • H04N 19/186 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par l’unité de codage, c. à d. la partie structurelle ou sémantique du signal vidéo étant l’objet ou le sujet du codage adaptatif l’unité étant une couleur ou une composante de chrominance

83.

INTER CODING USING DEEP LEARNING IN VIDEO COMPRESSION

      
Numéro d'application US2023026132
Numéro de publication 2024/006167
Statut Délivré - en vigueur
Date de dépôt 2023-06-23
Date de publication 2024-01-04
Propriétaire DOLBY LABORATORIES LICENSING CORPORATION (USA)
Inventeur(s)
  • Shingala, Jay Nitin
  • Mohananchettiar, Arunkumar
  • Sharma, Pankaj
  • Arora, Arjun
  • Shao, Tong
  • Yin, Peng

Abrégé

Methods, systems, and bitstream syntax are described for inter-frame coding using end-to-end neural networks used in image and video compression. Inter-frame coding methods include one or more of: joint luma-chroma motion compensation for YUV pictures, joint luma-chroma residual coding for YUV pictures, using attention layers, enabling temporal motion prediction networks for motion vector prediction, using a cross-domain network which combines motion vector and residue information for motion vectors decoding, using the cross-domain network for decoding residuals, using weighted motion-compensated inter prediction, and using temporal only, spatial only, or both temporal and spatial features in entropy decoding. Methods to improve training of neural networks for inter-frame coding are also described.

Classes IPC  ?

  • H04N 19/70 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques caractérisés par des aspects de syntaxe liés au codage vidéo, p.ex. liés aux standards de compression
  • H04N 19/90 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant des techniques de codage non prévues dans les groupes , p.ex. les fractales
  • G06N 3/0455 - Réseaux auto-encodeurs; Réseaux encodeurs-décodeurs
  • G06N 3/0464 - Réseaux convolutifs [CNN, ConvNet]

84.

SEPARATION AND RENDERING OF HEIGHT OBJECTS

      
Numéro d'application US2023068969
Numéro de publication 2024/006671
Statut Délivré - en vigueur
Date de dépôt 2023-06-23
Date de publication 2024-01-04
Propriétaire DOLBY LABORATORIES LICENSING CORPORATION (USA)
Inventeur(s)
  • Shuang, Zhiwei
  • Ma, Yuanxing
  • Sun, Jundai
  • Liu, Yang
  • Yang, Ziyu

Abrégé

The present disclosure relates to a method and system for processing audio, as well as a computer program product comprising instructions which, when the program is executed by a computer, causes the computer to carry out the method. The method comprises obtaining an input audio signal and processing the input audio signal to extract a height audio object from the input audio signal, wherein the height audio object is extracted using a source separation module configured to extract an audio object of a predetermined height audio source type. The method further comprises rendering the input audio signal to a multi-channel presentation such that the at least one height audio object is included in at least one height channel of the multi-channel presentation.

Classes IPC  ?

  • H04S 5/00 - Systèmes pseudo-stéréophoniques, p.ex. dans lesquels les signaux d'un canal supplémentaire sont dérivés du signal monophonique par déphasage, retardement ou réverbération

85.

AUDIO DE-REVERBERATION

      
Numéro d'application US2023069195
Numéro de publication 2024/006778
Statut Délivré - en vigueur
Date de dépôt 2023-06-27
Date de publication 2024-01-04
Propriétaire DOLBY LABORATORIES LICENSING CORPORATION (USA)
Inventeur(s)
  • Dai, Jia
  • Li, Kai

Abrégé

elsdd. With the proposed approach, a "soft" separation of the real AIR into an early AIR and a late AIR. Specifically, the early AIR will decay to zero during a transition period d, while the late AIR will gradually increase from zero during the transition period. The sum of the early AIR and late AIR will still be equal to the real AIR.

Classes IPC  ?

  • G10L 21/0208 - Filtration du bruit
  • H04S 7/00 - Dispositions pour l'indication; Dispositions pour la commande, p.ex. pour la commande de l'équilibrage
  • G10L 25/30 - Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par la technique d’analyse utilisant des réseaux neuronaux

86.

FRAME-LEVEL PERMUTATION INVARIANT TRAINING FOR SOURCE SEPARATION

      
Numéro d'application 18248801
Statut En instance
Date de dépôt 2021-10-13
Date de la première publication 2024-01-04
Propriétaire
  • Dolby Laboratories Licensing Corporation (USA)
  • DOLBY INTERNATIONAL AB (Irlande)
Inventeur(s)
  • Liu, Xiaoyu
  • Pons Puig, Jordi

Abrégé

Described is a method of training a deep-learning-based system for sound source separation. The system comprises a separation stage for frame-wise extraction of representations of sound sources from a representation of an audio signal, and a clustering stage for generating, for each frame, a vector indicative of an assignment permutation of extracted frames of representations of sound sources to respective sound sources. The representation of the audio signal is a waveform-based representation. The separation stage is trained using frame-level permutation invariant training. Further, the clustering stage is trained to generate embedding vectors for the frames of the audio signal that allow to determine estimates of respective assignment permutations between extracted sound signals and labels of sound sources that had been used for the frames. Also described is a method of using the deep-learning-based system for sound source separation.

Classes IPC  ?

  • G10L 21/028 - Séparation du signal de voix utilisant les propriétés des sources sonores

87.

METHODS, APPARATUS AND SYSTEMS FOR DECOMPRESSING A HIGHER ORDER AMBISONICS (HOA) SIGNAL

      
Numéro d'application 18339368
Statut En instance
Date de dépôt 2023-06-22
Date de la première publication 2024-01-04
Propriétaire Dolby Laboratories Licensing Corporation (USA)
Inventeur(s)
  • Kordon, Sven
  • Krueger, Alexander
  • Wuebbolt, Oliver

Abrégé

A method for compressing a HOA signal being an input HOA representation with input time frames (C(k)) of HOA coefficient sequences comprises spatial HOA encoding of the input time frames and subsequent perceptual encoding and source encoding. Each input time frame is decomposed (802) into a frame of predominant sound signals (XPS(k−1)) and a frame of an ambient HOA component ({tilde over (C)}AMB(k−1)). The ambient HOA component ({tilde over (C)}AMB(k−1)) comprises, in a layered mode, first HOA coefficient sequences of the input HOA representation (cn(k−1)) in lower positions and second HOA coefficient sequences (cAMB,n(k−1)) in remaining higher positions. The second HOA coefficient sequences are part of an HOA representation of a residual between the input HOA representation and the HOA representation of the predominant sound signals.

Classes IPC  ?

  • H04S 3/00 - Systèmes utilisant plus de deux canaux, p.ex. systèmes quadriphoniques
  • G10L 19/008 - Codage ou décodage du signal audio multi-canal utilisant la corrélation inter-canaux pour réduire la redondance, p.ex. stéréo combinée, codage d’intensité ou matriçage
  • G10L 19/24 - Codecs à débit variable, p.ex. pour générer différentes qualités en utilisant une représentation évolutive comme le codage hiérarchique ou le codage par couches
  • H04S 7/00 - Dispositions pour l'indication; Dispositions pour la commande, p.ex. pour la commande de l'équilibrage

88.

SIGNAL RESHAPING AND CODING FOR HDR AND WIDE COLOR GAMUT SIGNALS

      
Numéro d'application 18470353
Statut En instance
Date de dépôt 2023-09-19
Date de la première publication 2024-01-04
Propriétaire DOLBY LABORATORIES LICENSING CORPORATION (USA)
Inventeur(s)
  • Yin, Peng
  • Lu, Taoran
  • Pu, Fangjun
  • Chen, Tao
  • Husak, Walter J.

Abrégé

In a method to improve the coding efficiency of high-dynamic range (HDR) images, a decoder parses sequence processing set (SPS) data from an input coded bitstream to detect that an HDR extension syntax structure is present in the parsed SPS data. It extracts from the HDR extension syntax structure post-processing information that includes one or more of a color space enabled flag, a color enhancement enabled flag, an adaptive_reshaping_enabled_flag, a dynamic range conversion flag, a color correction enabled flag, or an SDR_viewable_flag. It decodes the input bitstream to generate a preliminary output decoded signal, and generates a second output signal based on the preliminary output signal and the post-processing information.

Classes IPC  ?

  • H04N 19/70 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques caractérisés par des aspects de syntaxe liés au codage vidéo, p.ex. liés aux standards de compression
  • H04N 19/186 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par l’unité de codage, c. à d. la partie structurelle ou sémantique du signal vidéo étant l’objet ou le sujet du codage adaptatif l’unité étant une couleur ou une composante de chrominance
  • H04N 19/30 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant des techniques hiérarchiques, p.ex. l'échelonnage
  • H04N 19/85 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le pré-traitement ou le post-traitement spécialement adaptés pour la compression vidéo
  • G06T 5/00 - Amélioration ou restauration d'image

89.

ENHANCEMENT OF TEXTURE AND ALPHA CHANNELS IN MULTIPLANE IMAGES

      
Numéro d'application US2023069096
Numéro de publication 2024/006710
Statut Délivré - en vigueur
Date de dépôt 2023-06-26
Date de publication 2024-01-04
Propriétaire DOLBY LABORATORIES LICENSING CORPORATION (USA)
Inventeur(s)
  • Su, Guan-Ming
  • Yin, Peng

Abrégé

Image-processing technique directed at improving the quality of viewable images generated by rendering a multiplane image having a plurality of pixels and represented by a plurality of layers corresponding to different respective distances from the reference camera position. In an example embodiment, the image-processing technique includes one or more of the following operations: (A) for a first set of pixels, scaling respective weights of the layers to cause a sum of the scaled weights to be normalized to one; (B) for a second set of pixels, replacing respective alpha and texture values in the layers by the corresponding local average values; and (C) for a third set of pixels, scaling corresponding texture values in the layers such that, for the resulting viewable image rendered for the reference camera position, texture values of the third set match the respective texture values of the source image captured from the reference camera position.

Classes IPC  ?

90.

TIMESTAMP SMOOTHING TO REMOVE JITTER

      
Numéro d'application 18252998
Statut En instance
Date de dépôt 2021-11-17
Date de la première publication 2023-12-28
Propriétaire Dolby Laboratories Licensing Corporation (USA)
Inventeur(s)
  • Prema Thasarathan, Shanush
  • Wang, Ning
  • Samarasekera, Senaka Chandranath

Abrégé

Embodiments are disclosed for timestamp smoothing to remove jitter. In some embodiments, a method of smoothing timestamps associated with audio packets comprises: receiving, using at least one processor, a series of input timestamps for audio packets and their respective packet lengths; estimating, using the at least one processor, an initial timestamp based on the series of input timestamps, the packet lengths and a sample time; calculating, using the at least one processor, a predicted timestamp based on the estimated initial timestamp; and smoothing, using the at least one processor, the predicted timestamp.

Classes IPC  ?

  • H04L 47/283 - Commande de flux; Commande de la congestion par rapport à des considérations temporelles en réponse à des retards de traitement, p.ex. causés par une gigue ou un temps d'aller-retour [RTT]
  • H04L 43/106 - Surveillance active, p.ex. battement de cœur, utilitaire Ping ou trace-route en utilisant des informations liées au temps dans des paquets, p.ex. en ajoutant des horodatages
  • H04L 41/147 - Analyse ou conception de réseau pour prédire le comportement du réseau

91.

SUBBAND DOMAIN ACOUSTIC ECHO CANCELLER BASED ACOUSTIC STATE ESTIMATOR

      
Numéro d'application 18255573
Statut En instance
Date de dépôt 2021-12-02
Date de la première publication 2023-12-28
Propriétaire DOLBY LABORATORIES LICENSING CORPORATION (USA)
Inventeur(s)
  • Southwell, Benjamin John
  • Gunawan, David
  • Hines, Christopher Graham

Abrégé

Some implementations involve receiving, from a first subband domain acoustic echo canceller (AEC) of a first audio device in an audio environment, first adaptive filter management data from each of a plurality of first adaptive filter management modules, each first adaptive filter management module corresponding to a subband of the first subband domain AEC, each first adaptive filter management module being configured to control a first plurality of adaptive filters. The first plurality of adaptive filters may include at least a first adaptive filter type and a second adaptive filter type. Some implementations involve extracting, from the first adaptive filter management data, a first plurality of extracted features corresponding to a plurality of subbands of the first subband domain AEC and estimating a current local acoustic state based, at least in part, on the first plurality of extracted features.

Classes IPC  ?

  • H04R 3/02 - Circuits pour transducteurs pour empêcher la réaction acoustique

92.

POST-PROCESSING GAINS FOR SIGNAL ENHANCEMENT

      
Numéro d'application 18344782
Statut En instance
Date de dépôt 2023-06-29
Date de la première publication 2023-12-28
Propriétaire DOLBY LABORATORIES LICENSING CORPORATION (USA)
Inventeur(s)
  • Sun, Xuejing
  • Dickins, Glenn N.

Abrégé

A method, an apparatus, and logic to post-process raw gains determined by input processing to generate post-processed gains, comprising using one or both of delta gain smoothing and decision-directed gain smoothing. The delta gain smoothing comprises applying a smoothing filter to the raw gain with a smoothing factor that depends on the gain delta: the absolute value of the difference between the raw gain for the current frame and the post-processed gain for a previous frame. The decision-directed gain smoothing comprises converting the raw gain to a signal-to-noise ratio, applying a smoothing filter with a smoothing factor to the signal-to-noise ratio to calculate a smoothed signal-to-noise ratio, and converting the smoothed signal-to-noise ratio to determine the second smoothed gain, with smoothing factor possibly dependent on the gain delta.

Classes IPC  ?

  • G10L 21/0364 - Amélioration de l'intelligibilité de la parole, p.ex. réduction de bruit ou annulation d'écho en changeant l’amplitude pour améliorer l'intelligibilité
  • G10L 21/0316 - Amélioration de l'intelligibilité de la parole, p.ex. réduction de bruit ou annulation d'écho en changeant l’amplitude
  • G10K 11/16 - Procédés ou dispositifs de protection contre le bruit ou les autres ondes acoustiques ou pour amortir ceux-ci, en général
  • H03G 3/32 - Commande automatique dans des amplificateurs comportant des dispositifs semi-conducteurs le réglage dépendant du niveau de bruit ambiant ou du niveau sonore ambiant
  • G10L 21/0224 - Traitement dans le domaine temporel
  • G10L 21/034 - Réglage automatique
  • G10L 25/78 - Détection de la présence ou de l’absence de signaux de voix
  • H03G 3/30 - Commande automatique dans des amplificateurs comportant des dispositifs semi-conducteurs

93.

DIRECTED INTERPOLATION AND DATA POST-PROCESSING

      
Numéro d'application 18466957
Statut En instance
Date de dépôt 2023-09-14
Date de la première publication 2023-12-28
Propriétaire DOLBY LABORATORIES LICENSING CORPORATION (USA)
Inventeur(s)
  • Tourapis, Alexandros
  • Leontaris, Athanasios
  • Pahalawatta, Peshala V.
  • Stec, Kevin J.

Abrégé

An encoding device evaluates a plurality of processing and/or post-processing algorithms and/or methods to be applied to a video stream, and signals a selected method, algorithm, class or category of methods/algorithms either in an encoded bitstream or as side information related to the encoded bitstream. A decoding device or post-processor utilizes the signaled algorithm or selects an algorithm/method based on the signaled method or algorithm. The selection is based, for example, on availability of the algorithm/method at the decoder/post-processor and/or cost of implementation. The video stream may comprise, for example, downsampled multiplexed stereoscopic images and the selected algorithm may include any of upconversion and/or error correction techniques that contribute to a restoration of the downsampled images.

Classes IPC  ?

  • H04N 19/597 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage prédictif spécialement adapté pour l’encodage de séquences vidéo multi-vues
  • H04N 19/80 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques - Détails des opérations de filtrage spécialement adaptées à la compression vidéo, p.ex. pour l'interpolation de pixels
  • H04N 19/17 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par l’unité de codage, c. à d. la partie structurelle ou sémantique du signal vidéo étant l’objet ou le sujet du codage adaptatif l’unité étant une zone de l'image, p.ex. un objet
  • H04N 13/161 - Encodage, multiplexage ou démultiplexage de différentes composantes des signaux d’images
  • H04N 13/172 - Traitement de signaux d’images les signaux d’images comprenant des composantes non requises pour l’affichage de l’image, p.ex. des titres ou des informations sur le format
  • H04N 13/178 - Métadonnées, p.ex. informations sur la disparité
  • H04N 13/218 - Générateurs de signaux d’images utilisant des caméras à images stéréoscopiques utilisant un seul capteur d’images 2D utilisant le multiplexage spatial
  • H04N 19/154 - Qualité visuelle après décodage mesurée ou estimée de façon subjective, p.ex. mesure de la distorsion
  • H04N 19/85 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le pré-traitement ou le post-traitement spécialement adaptés pour la compression vidéo
  • H04N 19/44 - Décodeurs spécialement adaptés à cet effet, p.ex. décodeurs vidéo asymétriques par rapport à l’encodeur
  • H04N 19/895 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le pré-traitement ou le post-traitement spécialement adaptés pour la compression vidéo mettant en œuvre des procédés ou des dispositions de détection d'erreurs de transmission au niveau du décodeur combiné à la dissimulation d’erreurs
  • H04N 19/70 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques caractérisés par des aspects de syntaxe liés au codage vidéo, p.ex. liés aux standards de compression
  • H04N 19/86 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le pré-traitement ou le post-traitement spécialement adaptés pour la compression vidéo mettant en œuvre la diminution des artéfacts de codage, p.ex. d'artéfacts de blocs
  • H04N 7/01 - Conversion des normes
  • H04N 21/434 - Désassemblage d'un flux multiplexé, p.ex. démultiplexage de flux audio et vidéo, extraction de données additionnelles d'un flux vidéo; Remultiplexage de flux multiplexés; Extraction ou traitement de SI; Désassemblage d'un flux élémentaire mis en paquets
  • H04N 19/176 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par l’unité de codage, c. à d. la partie structurelle ou sémantique du signal vidéo étant l’objet ou le sujet du codage adaptatif l’unité étant une zone de l'image, p.ex. un objet la zone étant un bloc, p.ex. un macrobloc
  • H04N 19/587 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage prédictif mettant en œuvre un sous-échantillonnage ou une interpolation temporels, p.ex. décimation ou interpolation subséquente d’images dans une séquence vidéo
  • H04N 19/172 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par l’unité de codage, c. à d. la partie structurelle ou sémantique du signal vidéo étant l’objet ou le sujet du codage adaptatif l’unité étant une zone de l'image, p.ex. un objet la zone étant une image, une trame ou un champ
  • H04N 19/423 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques - caractérisés par les détails de mise en œuvre ou le matériel spécialement adapté à la compression ou à la décompression vidéo, p.ex. la mise en œuvre de logiciels spécialisés caractérisés par les dispositions des mémoires

94.

DIRECTED INTERPOLATION AND DATA POST-PROCESSING

      
Numéro d'application 18466961
Statut En instance
Date de dépôt 2023-09-14
Date de la première publication 2023-12-28
Propriétaire DOLBY LABORATORIES LICENSING CORPORATION (USA)
Inventeur(s)
  • Tourapis, Alexandros
  • Leontaris, Athanasios
  • Pahalawatta, Peshala V.
  • Stec, Kevin J.

Abrégé

An encoding device evaluates a plurality of processing and/or post-processing algorithms and/or methods to be applied to a video stream, and signals a selected method, algorithm, class or category of methods/algorithms either in an encoded bitstream or as side information related to the encoded bitstream. A decoding device or post-processor utilizes the signaled algorithm or selects an algorithm/method based on the signaled method or algorithm. The selection is based, for example, on availability of the algorithm/method at the decoder/post-processor and/or cost of implementation. The video stream may comprise, for example, downsampled multiplexed stereoscopic images and the selected algorithm may include any of upconversion and/or error correction techniques that contribute to a restoration of the downsampled images.

Classes IPC  ?

  • H04N 19/597 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage prédictif spécialement adapté pour l’encodage de séquences vidéo multi-vues
  • H04N 19/80 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques - Détails des opérations de filtrage spécialement adaptées à la compression vidéo, p.ex. pour l'interpolation de pixels
  • H04N 19/17 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par l’unité de codage, c. à d. la partie structurelle ou sémantique du signal vidéo étant l’objet ou le sujet du codage adaptatif l’unité étant une zone de l'image, p.ex. un objet
  • H04N 13/161 - Encodage, multiplexage ou démultiplexage de différentes composantes des signaux d’images
  • H04N 13/172 - Traitement de signaux d’images les signaux d’images comprenant des composantes non requises pour l’affichage de l’image, p.ex. des titres ou des informations sur le format
  • H04N 13/178 - Métadonnées, p.ex. informations sur la disparité
  • H04N 13/218 - Générateurs de signaux d’images utilisant des caméras à images stéréoscopiques utilisant un seul capteur d’images 2D utilisant le multiplexage spatial
  • H04N 19/154 - Qualité visuelle après décodage mesurée ou estimée de façon subjective, p.ex. mesure de la distorsion
  • H04N 19/85 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le pré-traitement ou le post-traitement spécialement adaptés pour la compression vidéo
  • H04N 19/44 - Décodeurs spécialement adaptés à cet effet, p.ex. décodeurs vidéo asymétriques par rapport à l’encodeur
  • H04N 19/895 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le pré-traitement ou le post-traitement spécialement adaptés pour la compression vidéo mettant en œuvre des procédés ou des dispositions de détection d'erreurs de transmission au niveau du décodeur combiné à la dissimulation d’erreurs
  • H04N 19/70 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques caractérisés par des aspects de syntaxe liés au codage vidéo, p.ex. liés aux standards de compression
  • H04N 19/86 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le pré-traitement ou le post-traitement spécialement adaptés pour la compression vidéo mettant en œuvre la diminution des artéfacts de codage, p.ex. d'artéfacts de blocs
  • H04N 7/01 - Conversion des normes
  • H04N 21/434 - Désassemblage d'un flux multiplexé, p.ex. démultiplexage de flux audio et vidéo, extraction de données additionnelles d'un flux vidéo; Remultiplexage de flux multiplexés; Extraction ou traitement de SI; Désassemblage d'un flux élémentaire mis en paquets
  • H04N 19/176 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par l’unité de codage, c. à d. la partie structurelle ou sémantique du signal vidéo étant l’objet ou le sujet du codage adaptatif l’unité étant une zone de l'image, p.ex. un objet la zone étant un bloc, p.ex. un macrobloc
  • H04N 19/587 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage prédictif mettant en œuvre un sous-échantillonnage ou une interpolation temporels, p.ex. décimation ou interpolation subséquente d’images dans une séquence vidéo
  • H04N 19/172 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par l’unité de codage, c. à d. la partie structurelle ou sémantique du signal vidéo étant l’objet ou le sujet du codage adaptatif l’unité étant une zone de l'image, p.ex. un objet la zone étant une image, une trame ou un champ
  • H04N 19/423 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques - caractérisés par les détails de mise en œuvre ou le matériel spécialement adapté à la compression ou à la décompression vidéo, p.ex. la mise en œuvre de logiciels spécialisés caractérisés par les dispositions des mémoires

95.

MULTI-HALF-TONE IMAGING AND DUAL MODULATION PROJECTION/DUAL MODULATION LASER PROJECTION

      
Numéro d'application 18466976
Statut En instance
Date de dépôt 2023-09-14
Date de la première publication 2023-12-28
Propriétaire DOLBY LABORATORIES LICENSING CORPORATION (USA)
Inventeur(s)
  • Richards, Martin J.
  • Shields, Jerome

Abrégé

Smaller halftone tiles are implemented on a first modulator of a dual modulation projection system. This techniques uses multiple halftones per frame in the pre-modulator synchronized with a modified bit sequence in the primary modulator to effectively increase the number of levels provided by a given tile size in the halftone modulator. It addresses the issue of reduced contrast ratio at low light levels for small tile sizes and allows the use of smaller PSFs which reduce halo artifacts in the projected image and may be utilized in 3D projecting and viewing.

Classes IPC  ?

  • H04N 9/31 - Dispositifs de projection pour la présentation d'images en couleurs
  • G09G 3/20 - Dispositions ou circuits de commande présentant un intérêt uniquement pour l'affichage utilisant des moyens de visualisation autres que les tubes à rayons cathodiques pour la présentation d'un ensemble de plusieurs caractères, p.ex. d'une page, en composant l'ensemble par combinaison d'éléments individuels disposés en matrice

96.

SPEECH ENHANCEMENT AND INTERFERENCE SUPPRESSION

      
Numéro d'application US2023025770
Numéro de publication 2023/249957
Statut Délivré - en vigueur
Date de dépôt 2023-06-20
Date de publication 2023-12-28
Propriétaire DOLBY LABORATORIES LICENSING CORPORATION (USA)
Inventeur(s) Wang, Ning

Abrégé

Methods, systems, and media for processing audio are provided. In some embodiments, a method involves receiving, from a plurality of microphones, an input audio signal. The method may involve identifying an angle of arrival associated with the input audio signal. The method may involve determining a plurality of gains corresponding to a plurality of bands of the input audio signal based on a combination of at least: 1) a representation of a covariance of signals associated with microphones of the plurality of microphones on a per-band basis; and 2) the angle of arrival. The method may involve applying the plurality of gains to the plurality of bands of the input audio signal such that at least a portion of the input audio signal is suppressed to form an enhanced audio signal.

Classes IPC  ?

  • G10L 21/0264 - Filtration du bruit caractérisée par le type de mesure du paramètre, p.ex. techniques de corrélation, techniques de passage par zéro ou techniques prédictives
  • G10L 21/0216 - Filtration du bruit caractérisée par le procédé d’estimation du bruit

97.

METHODS AND SYSTEMS FOR INTERACTIVE RENDERING OF OBJECT BASED AUDIO

      
Numéro d'application 18346464
Statut En instance
Date de dépôt 2023-07-03
Date de la première publication 2023-12-28
Propriétaire
  • Dolby Laboratories Licensing Corporation (USA)
  • DOLBY INTERNATIONAL AB (Irlande)
Inventeur(s)
  • France, Robert Andrew
  • Ziegler, Thomas
  • Mehta, Sripal S.
  • Dowell, Andrew Jonathan
  • Saungsomboon, Prinyar
  • Dwyer, Michael David
  • Farahani, Farhad
  • Tsingos, Nicolas R.
  • Sanchez, Freddie

Abrégé

Methods for generating an object based audio program which is renderable in a personalizable manner, e.g., to provide an immersive, perception of audio content of the program. Other embodiments include steps of delivering (e.g., broadcasting), decoding, and/or rendering such a program. Rendering of audio objects indicated by the program may provide an immersive experience. The audio content of the program may be indicative of multiple object channels (e.g., object channels indicative of user-selectable and user-configurable objects, and typically also a default set of objects which will be rendered in the absence of a selection by a user) and a bed of speaker channels. Another aspect is an audio processing unit (e.g., encoder or decoder) configured to perform, or which includes a buffer memory which stores at least one frame (or other segment) of an object based audio program (or bitstream thereof) generated in accordance with, any embodiment of the method.

Classes IPC  ?

  • G10L 19/008 - Codage ou décodage du signal audio multi-canal utilisant la corrélation inter-canaux pour réduire la redondance, p.ex. stéréo combinée, codage d’intensité ou matriçage
  • G10L 19/20 - Vocodeurs utilisant des modes multiples utilisant un codage spécifique de la catégorie de son, des encodeurs hybrides ou un codage basé objet
  • H04S 7/00 - Dispositions pour l'indication; Dispositions pour la commande, p.ex. pour la commande de l'équilibrage
  • G06F 3/16 - Entrée acoustique; Sortie acoustique
  • H04S 3/00 - Systèmes utilisant plus de deux canaux, p.ex. systèmes quadriphoniques

98.

IMPROVING BASS RESPONSE FOR A SPEAKER IN A PORTABLE COMPUTING DEVICE

      
Numéro d'application 18037650
Statut En instance
Date de dépôt 2021-11-17
Date de la première publication 2023-12-28
Propriétaire DOLBY LABORATORIES LICENSING CORPORATION (USA)
Inventeur(s)
  • Xu, Xiaojun
  • Liu, Tiezhong

Abrégé

Methods and systems of improving bass response for a speaker in a portable computing device are described. One portable computing device includes first and second cover parts that are joined together to form a casing of the portable computing device, wherein a speaker volume is formed between portions of the first and second cover parts; a speaker arranged within the speaker volume; and one or more elastic spacers arranged between the first and second cover parts. The one or more elastic spacers are arranged to counteract, by their elastic recoil forces, a compression of the speaker volume when the first and second cover parts are under external compressing forces. The one or more elastic spacers are arranged between the first and second cover parts to be partially compressed by the first and second cover parts in the absence of external compressing forces on the first and second cover parts.

Classes IPC  ?

  • H04R 3/04 - Circuits pour transducteurs pour corriger la fréquence de réponse

99.

METHODS AND APPARATUS FOR DECODING A COMPRESSED HOA SIGNAL

      
Numéro d'application 18464505
Statut En instance
Date de dépôt 2023-09-11
Date de la première publication 2023-12-28
Propriétaire Dolby Laboratories Licensing Corporation (USA)
Inventeur(s)
  • Kordon, Sven
  • Krueger, Alexander
  • Wuebbolt, Oliver

Abrégé

Methods and apparatus for decoding a compressed Higher Order Ambisonics (HOA) representation of a sound or soundfield. The method may include receiving a bit stream containing the compressed HOA representation and decoding, based on a determination that there are multiple layers, the compressed HOA representation from the bitstream to obtain a sequence of decoded HOA representations. A first subset of the sequence of decoded HOA representations is determined based only on corresponding ambient HOA components. A second subset of the sequence of decoded HOA representations is determined based on corresponding ambient HOA components and corresponding predominant sound components. For a frame k, the sequence of decoded HOA representations are represented at least in part by Methods and apparatus for decoding a compressed Higher Order Ambisonics (HOA) representation of a sound or soundfield. The method may include receiving a bit stream containing the compressed HOA representation and decoding, based on a determination that there are multiple layers, the compressed HOA representation from the bitstream to obtain a sequence of decoded HOA representations. A first subset of the sequence of decoded HOA representations is determined based only on corresponding ambient HOA components. A second subset of the sequence of decoded HOA representations is determined based on corresponding ambient HOA components and corresponding predominant sound components. For a frame k, the sequence of decoded HOA representations are represented at least in part by c ^ ~ n ( k - 1 ) = { c ^ AMB , n ( k - 1 ) for ⁢ n ⁢ in ⁢ the ⁢ first ⁢ subset c ^ n ( k - 1 ) = c ^ PS , n ( k - 1 ) + c ^ AMB , n ( k - 1 ) , for ⁢ n ⁢ in ⁢ the ⁢ second ⁢ subset where ĉAMB,n(k−1) corresponds to the corresponding ambient HOA components and ĉPS,n(k−1) corresponds to the corresponding predominant sound components.

Classes IPC  ?

  • G10L 19/008 - Codage ou décodage du signal audio multi-canal utilisant la corrélation inter-canaux pour réduire la redondance, p.ex. stéréo combinée, codage d’intensité ou matriçage
  • H04S 3/00 - Systèmes utilisant plus de deux canaux, p.ex. systèmes quadriphoniques
  • G10L 19/24 - Codecs à débit variable, p.ex. pour générer différentes qualités en utilisant une représentation évolutive comme le codage hiérarchique ou le codage par couches

100.

METHOD AND DEVICE FOR ARITHMETIC ENCODING OR ARITHMETIC DECODING

      
Numéro d'application 18465479
Statut En instance
Date de dépôt 2023-09-12
Date de la première publication 2023-12-28
Propriétaire DOLBY LABORATORIES LICENSING CORPORATION (USA)
Inventeur(s) Wuebbolt, Oliver

Abrégé

The invention proposes a method and a device for arithmetic encoding of a current spectral coefficient using preceding spectral coefficients. Said preceding spectral coefficients are already encoded and both, said preceding and current spectral coefficients, are comprised in one or more quantized spectra resulting from quantizing time-frequency-transform of video, audio or speech signal sample values. The invention proposes a method and a device for arithmetic encoding of a current spectral coefficient using preceding spectral coefficients. Said preceding spectral coefficients are already encoded and both, said preceding and current spectral coefficients, are comprised in one or more quantized spectra resulting from quantizing time-frequency-transform of video, audio or speech signal sample values. Said method comprises processing the preceding spectral coefficients, using the processed preceding spectral coefficients for determining a context class being one of at least two different context classes, using the determined context class and a mapping from the at least two different context classes to at least two different probability density functions for determining the probability density function, and arithmetic encoding the current spectral coefficient based on the determined probability density function wherein processing the preceding spectral coefficients comprises non-uniformly quantizing absolutes of the preceding spectral coefficients for use in determining of the context class.

Classes IPC  ?

  • H03M 7/40 - Conversion en, ou à partir de codes de longueur variable, p.ex. code Shannon-Fano, code Huffman, code Morse
  • H04N 19/124 - Quantification
  • H04N 19/182 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par l’unité de codage, c. à d. la partie structurelle ou sémantique du signal vidéo étant l’objet ou le sujet du codage adaptatif l’unité étant un pixel
  1     2     3     ...     39        Prochaine page