Ja faz algum tempo que venho estudando a possibilidade de um pic reconhecer pelo menos duas palavras. Acho que agora achei um caminho:
Primeiro de tudo, fazer um amplificador que entregue um sinal "clipado", isto e', saturado, onde a grandeza que varia seria, unica e exclusivamente a frequencia, pois se for analisar frequencia e intensidade, vai ficar muito complexo. Achei um esquema com o LM 386, com um ganho absurdo de mais e 50 db, com enfase entre 500 e 5 Khz, onde situa-se geralmente a voz humana. Agora e' analisar os resultados nessas frequencias.