In quel file ci sono due parole che si ripetono (MAJIKTHISE e VROOMFONDEL), quindi se memorizzi le parole in una struttura tipo dizionario o set, in cui chiavi e elementi sono unici, la lista che dai in output conterrà meno elementi di quello che deve contenere. Mi pare che quel file sia l'unico in cui ci sono parole che si ripetono. La cosa strana è che ti manca un solo -1, anziché due, ma forse ti è sfuggito il secondo che manca.