Nomes de Domínios Internacionalizados (IDNs) são endereços da Web ou nomes de domínios de segundo nível registrados em qualquer script ou conjunto de caracteres definido em Unicode. Compreender como os IDNs da VeriSign suportam o registro de nome de domínio em centenas de idiomas nativos com um único Sistema de Registro Compartilhado (SRS) requer um entendimento de como caracteres e scripts são utilizados em linguagem escrita e traduzidos para a computação.
| Script | Latino | Árabe | Han | Grego |
| Caractere | L | س | æ¼¢å— | Ω |
| Idioma | Inglês | Persa | Chinês | Grego |
Script
Um script é uma coleção de símbolos utilizados para representar informações textuais em um idioma. Exemplos de scripts: latino, árabe, han, grego.
Caractere
Um caractere é o bloco de construção básico de qualquer script e, portanto, de qualquer língua escrita. Ele invoca um significado a um nível fundamental; você não pode mais dividir um caractere e ainda ter um significado.
Linguagem escrita
Uma linguagem escrita utiliza caracteres de um ou mais scripts para comunicar o significado. Exemplos de línguas: inglês, persa, chinês, grego.
Adaptação da linguagem para computadores
Scripts diferentes usam teclados diferentes ou teclados virtuais para poderem ser inseridos em dispositivos de computação. Sistemas operacionais de computador possuem Input Method Editors (IME), que facilitam a inserção de scripts diferentes. Os IDNs são um tipo semelhante de adaptação, permitindo que as pessoas usem seu script de idioma local para navegar na Web, enviar e receber e-mails, transferência de arquivos e outros aplicativos que requerem nomes de domínios.
Unicode
Um computador usa a codificação de caracteres para compreendê-los. Para cada caractere em um conjunto de caracteres é atribuído um número exclusivo. Por exemplo, no conjunto codificado de caracteres ASCII, para o "A" maiúsculo é atribuído o número de 65. A maioria dos nomes de domínios são registrados em caracteres ASCII (A a Z, 0 a 9 e o hífen "-"). No entanto, palavras de outros idiomas que não sejam o inglês que requerem diacríticos, como o espanhol e o português, e línguas que utilizam scripts não-latinos, como o kanji e o árabe, não podem ser processadas em ASCII. O Unicode é um conjunto universal de caracteres codificados, que abrange mais de 350 diferentes idiomas nativos, essencialmente qualquer idioma que possa ser escrito em um dos scripts listados abaixo. Por esse motivo, IDNs usam Unicode.
Árabe
Armênio
Bengali
Bopomofo
Silábico canadense-aborígine
Cherokee
Cirílico
Devanágari
Etíope
Georgiano
Grego
Gurmukhi
Han (ideogramas japoneses, chineses, coreanos)
Hangul
Hebraico
Hiragana
Canarês
Katakana
Khmer
Laociano
Latino
Malaialo
Mongol
Birmanês
Ogham
Oriá
Runas
Cingalês
Sírio
Tâmil
Telegu
Thaana
Tailandês
Tibetano
Yi
Variantes
Os usuários finais normalmente registram nomes de domínios que têm significado em sua própria língua, como um nome, palavra ou frase. No entanto, um único script pode ser usado por mais de um idioma. Como resultado, um nome de domínio pode ter significados diferentes no contexto de outros idiomas ou culturas. O fenômeno variante foi classificado em quatro categorias diferentes: variantes de caracteres, ortográficas, lexêmicas e contextuais. A VeriSign determinou que o endereçamento de variantes de caractere é essencial para permitir que os usuários naveguem pela Internet em seus próprios idiomas. As outras variantes exigem difíceis decisões linguísticas que não são essenciais para o fornecimento de uma solução robusta de IDN. Saiba mais sobre variações de caracteres e tags de linguagem.

Websites Internacionais



