text_normalizing_map = {'à': 'A',
'á': 'A',
'?': 'A',
'?': 'A',
'?': 'A',
'è': 'E',
'é': 'E',
'ê': 'E',
'?': 'E',
'í': 'I',
'ì': 'I',
'?': 'I',
'?': 'I',
'ù': 'U',
'ú': 'U',
'?': 'U',
'ü': 'U',
'ò': 'O',
'ó': 'O',
'?': 'O',
'?': 'O',
'?': 'O',
'?': 'N',
'?': 'C',
'a': 'A',
'o': 'O',
'§': 'S',
'3': '3',
'2': '2',
'1': '1',
'à': 'a',
'á': 'a',
'a': 'a',
'?': 'a',
'?': 'a',
'è': 'e',
'é': 'e',
'ê': 'e',
'?': 'e',
'í': 'i',
'ì': 'i',
'?': 'i',
'?': 'i',
'ù': 'u',
'ú': 'u',
'?': 'u',
'ü': 'u',
'ò': 'o',
'ó': 'o',
'?': 'o',
'?': 'o',
'?': 'o',
'?': 'n',
'?': 'c'}
def normalize(text):
list_text = list(text)
for index, i in enumerate(list_text):
val = text_normalizing_map.get(i)
if(val):
list_text[index] = val
return "".join(list_text)
print(normalize("José Magalh?es "))
output
Jose Magalhaes