Outre les formats UTF-8 et UTF-32, il existe plusieurs autres encodages pour représenter les caractères Unicode, dont le UTF-16. Cet encodage est notamment utilisé dans certains systèmes d'exploitation (comme Windows) et dans certains langages de programmation (comme Java ou C#). Dans cet exercice, vous devez effectuer des conversions entre :
- des points de code Unicode (notation
U+XXXXouU+XXXXX) - leur encodage UTF-16
Nous n'avons pas vu au cours l'encodage UTF-16, et cet exercice a pour but de vous faire découvrir son fonctionnement en auto-apprentissage. Pour vous aider à comprendre cet encodage, vous pouvez vous appuyer sur les outils de votre choix (dont les LLMs). On vous conseille aussi les ressources suivantes:
- La page Wikipedia sur le UTF-16 : https://fr.wikipedia.org/wiki/UTF-16
- La RFC 2781 qui décrit le UTF-16 (Sections 1 et 2): https://datatracker.ietf.org/doc/html/rfc2781
Dans vos réponses, utilisez la notation hexadécimale préfixée par "0x" pour chaque unité de code UTF-16.
Par exemple, le point de code Unicode U+1F600 (le visage souriant)
s'encode en UTF-16 avec les unités de code 0xD83D et 0xDE00
et la réponse attendue est donc 0xD83D 0xDE00.
INGInious