Please ignore secret bonuses. Secret tests do NOT award bonus. Max hw grade is 30+2 bonus efficiency

Do you need help?

[HW4] Lettere accentate

1
1937764 (3520 points)
7 14 42
in HW4 obbligatorio by (3.5k points)

Nella consegna è indicato:

togliendo gli accenti dalle lettere accentate

Visto che è vietato importare moduli, anche se inclusi in Python, creati appositi per "normalizzare" caratteri diversi da a-z, mi chiedevo se fossero previste solo lettere accentate presenti sulla tastiera.

Esempio: lettere come àèìòù sono da considerare, altre come ā, Đ, ĥ, ĩ o tutti i caratteri speciali che non hanno semplici accenti (grave e acuto) ma tilde, barre, etc possono essere ignorati. Ovvero, non serve considerare tutti i praticamente infiniti caratteri nella codifica UTF-8 (http://www.fileformat.info/info/charset/UTF-8/list.htm)

796 views
closed

2 Answers

Best answer
AdSum (16290 points)
9 20 134
by (16.3k points)
selected by

Sono poesie, gli accenti presenti sulla tastiera servono per dare le inclinazioni fonetiche. A meno che non ci dia poesie scritte in demoniaco vedo dura la presenza di lettere come Đ o barre, quindi puoi anche ignorarle!
 

Mi rimangio tutto, per esempio è presente la "parola"

 pfxààÜØú

che viene tradotta in:

pfxaauou

Quindi si, devi prepararti anche al demoniaco.

Qualsiasi carattere speciale non "lettera" va ignorato, le lettere strane no, vanno tradotte

1
1937764 (3520 points)
7 14 42
by (3.5k points)
Contando che se vedi la tabella UTF-8 è immensa
G
Giordano_Dionisi (3100 points)
16 41 59
by (3.1k points)
sono 16 mila e passa caratteri... Al massimo lo chiederò al prof oggi a lezione proprio al volo
1
1937764 (3520 points)
7 14 42
by (3.5k points)

Professore scusi, ha detto che nel testo ha messo solo caratteri con ord() tra 0 e 255, ma già in random-10-rnd.txt ho trovato Ÿ (LATIN CAPITAL LETTER Y WITH DIAERESIS) che ha ord() = 376

G
Giordano_Dionisi (3100 points)
16 41 59
by (3.1k points)
Perchè penso devi considerare tutte le lettere dell'Unicode che sono dell'ordine di 16 mila e passa.. Non basta la cosa codifica ASCII
G
Giordano_Dionisi (3100 points)
16 41 59
by (3.1k points)
gusgus (1730 points)
5 8 31
by (1.7k points)
edited by
Sono poesie quindi non dovrebbero uscire casi in cui caratteri speciali sono presenti. Tuttavia andando a controllare nel file zippato, i file .json con cui fare i test sono tutti rinominati "random" + il numero di caratteri scelti casualmente. A questo punto non ti saprei dire se effettivamente i caratteri speciali siano assenti. L'unica cosa che posso consigliarti è di andare a tentativi in modo da capire se ci sia questa eventualità.

EDIT:

Mi sono letto velocemente i file e sembra che siano le parole quelle scelte a caso, quindi no, non ci sono caratteri speciali di quel tipo
andrea.sterbini (207920 points)
750 1267 2373
by (208k points)
Ho messo nel post dello HW 4 la lista delle vocali accentate