17 de marzo de 2021 [Programming, Tech]
Durante mi trabajo en RFC 8771, la notación de red internacionalizada deliberadamente ilegible (I-DUNNO), me encontré con una serie de preguntas. Lo estoy documentando aquí para poder enviárselo al autor e intentar mejorar mi comprensión de su intención.
Este es un RFC excelente y agradezco a los autores por sus esfuerzos para crearlo.
- Caracteres no imprimibles
En el 4.2. Nivel satisfactorio de confusiónEl RFC establece que una codificación puede considerarse satisfactoria si contiene “al menos un carácter no imprimible” (así como otra condición en esta sección).
Ambas implementaciones que conozco (lilyinstartlight y audeoudh) interpretan que “imprimible” significa lo mismo que la función isprintable() de Python: es decir, los caracteres no imprimibles son aquellos definidos en la base de datos de caracteres Unicode como “Otro” o “Separador”, excepto los espacios ASCII (0x20) que se consideran imprimibles.
Sin embargo, la definición de esta función puede ser específica de Python, ya que su intención parece estar relacionada con aspectos internos del lenguaje, como la función repr.
Sería útil saber exactamente qué se entiende por “caracteres no imprimibles” en el RFC.
- ¿Qué son los símbolos modificadores, los símbolos?
También en la sección 4.2El RFC menciona ‘”Caracteres de la categoría “Símbolo”‘.
La implementación de Python excluye los símbolos modificadores de su definición. Creo que esto no es correcto y he notado un problema sobre el tema: algunos caracteres de símbolo no se reconocen.
Sería útil si hubiera alguna aclaración al respecto.
- ¿Qué se entiende por “dirección diferente”?
Unicode clasifica caracteres en Bidi_Classes (por ejemplo, U+CED6E es Left_To_Right). En el 4.3. Emocionantes niveles de confusiónEl RFC se refiere a ‘Personajes de guiones con direcciones diferentes’.
Por lo que veo, hay dos posibles interpretaciones de esta frase:
- La codificación debe contener caracteres de al menos dos Bidi_Classes diferentes, o
- La codificación debe contener caracteres cuya dirección sea de izquierda a derecha y de derecha a izquierda, ya sea débil o fuerte.
Ambas implementaciones actuales interpretan esta declaración como la número 1, pero sospecho que la intención en realidad se parece más a la número 2.
Si lo que se entiende por número 2, creo que significa ignorar a los personajes con una dirección Neutral y tratar a los personajes con una dirección débil como la misma dirección que a los personajes con una dirección fuerte.
- ¿Qué es un personaje confuso?
Parte 4.3 menciona ‘Personaje clasificado como “Confundido”‘. Ambas implementaciones interpretan esto de manera vaga, con algo como “la codificación contiene cualquier carácter o subcadena que pueda confundirse con otro carácter o subcadena”.
Esto significa que se incluyen muchos caracteres “normales”: todos los dígitos ASCII y muchas letras latinas.
¿Era esta su intención?
Esas son todas mis preguntas. Fue muy divertido trabajar en este RFC.
Berita Terkini
Berita Terbaru
Daftar Terbaru
News
Berita Terbaru
Flash News
RuangJP
Pemilu
Berita Terkini
Prediksi Bola
Togel Deposit Pulsa
Technology
Otomotif
Berita Terbaru
Daftar Judi Slot Online Terpercaya
Slot yang lagi gacor
Teknologi
Berita terkini
Berita Pemilu
Berita Teknologi
Hiburan
master Slote
Berita Terkini
Pendidikan
Resep
Jasa Backlink
One Piece Terbaru