Per farlo devi usare il comando
re.findall('[0-9]{4}', la tua stringa) -> trova tutte le occorrenze di 4 cifre consecutive (utile per trovare gli anni di nascita ecc. ecc.)
re.findall('[0-9]{1,10}', la tua stringa) -> trova tutte le occorrenze da 1 a 10 cifre consecutive (utile per trovare la durata del film)
regex prende in input nelle sue funzioni una stringa che specifica che tipo di espressione stai cercando, per esempio:
'[0-9]{4}' significa : le parole formate da 4 caratteri contenuti nell'alfabeto [0,1,2,3,4,5,6,7,8,9] (scritto in forma abbreviata : [0-9])
Perchè usare regex? è potente e assolutamente versatile, imparare a usarlo potrà aiutarti in molte situazioni!
Perchè non usare Split? questo terzo Homework ti fornisce un esempio perfetto: i dati nella realtà sono sporchi! troverai le tue date di nascita degli attori messe in tutti i modi o addirittura completamente assenti, ti faccio un esempio:
21 July 2009, Los Angeles, California, USA -> qui puoi usare split(',') e poi cercare le 4 cifre
21 July 2009 a.d., Los Angeles, California, USA -> qui già non funziona più
21 July USA -> qui peggio ancora
inoltre ogni volta che ti dovrai cercare qualcosa in una stringa dovrai creare una funzione apposita, regex fa tutto questo per te!
Se vuoi imparare a usare regex (non ci vuole molto) leggi le doc ufficiali!