Una familia lingüística es un grupo de lenguas rigurosamente identificadas y es una unidad filogenética, es decir, todos sus miembros derivan de un ancestro común. Este antepasado es generalmente muy poco conocido, ya que la mayoría de los idiomas tienen una historia escrita muy corta.
A pesar de ello, es posible recuperar muchas de sus características aplicando el método comparativo, un procedimiento reconstructivo desarrollado en el siglo XIX por el lingüista August Schleicher. Esto puede demostrar la validez de muchas de las familias propuestas que se enumeran a continuación.
Las familias se pueden dividir en unidades filogenéticas más pequeñas, denominadas convencionalmente ramas familiares, porque la historia de una familia lingüística a menudo se representa mediante un diagrama de árbol. Sin embargo, el término “familia” no se restringe a ningún nivel de este “árbol”; la familia germánica, por ejemplo, es una rama de la familia indoeuropea.
LEE TAMBIÉN: Apuntes y definiciones sobre el idioma inglés, la lengua que conquista el mundo
Algunos taxónomos restringen el término “familia” hasta cierto punto, pero hay poco consenso sobre cómo hacerlo. Los que lo hacen normalmente también subdividen las ramas en grupos y los grupos en subgrupos, etc. Además, también agregan familias en phyla (también conocidas como superfamilias). Las superfamilias se utilizan a menudo para agregar familias de lenguas indígenas americanas. Una forma de hacer toda esta clasificación se llama glotocronología.
El ancestro común de una familia se conoce como protolenguaje. Por ejemplo, el protolenguaje reconstruible de la conocida familia indoeuropea se denomina protoindoeuropeo. Este idioma no se conoce a partir de registros escritos, ya que se hablaba antes de la invención de la escritura, pero a veces un protoidioma puede compararse con un idioma histórico conocido. De esta forma, dialectos provinciales del latín (llamado latín vulgar) dieron origen a las lenguas latinas, lo que hace que la lengua ancestral de las lenguas latinas sea muy parecida al latín (aunque menos parecida al latín literario de los escritores clásicos). Asimismo, los dialectos del nórdico antiguo se consideran protoidiomas del noruego, sueco, danés, feroés e islandés.
Los idiomas que no se pueden clasificar de manera confiable en ninguna familia se conocen como idiomas aislados. Un idioma aislado en su propia rama dentro de una familia, como el griego dentro de la familia indoeuropea, generalmente también se denomina idioma aislado, pero los casos como estos generalmente se aclaran. Por ejemplo, el griego puede considerarse una lengua indoeuropea aislada.
Las familias lingüísticas más grandes
Las seis familias de idiomas más grandes por recuento de idiomas son Níger-Congo, Austronesio, Trans-Nueva Guinea, Sino-Tibetano, Indo-Europeo y Afro-Asiático.
De las 142 familias lingüísticas diferentes, estas seis se destacan como las principales familias lingüísticas del mundo. Se pueden encontrar en todo el planeta, extendiéndose de manera única a diferentes regiones y países.
En esta página puedes encontrar un mapa con familias lingüísticas.

Cada una de estas familias tiene al menos el 5% de los idiomas del mundo y juntas representan dos tercios de todos los idiomas. Níger-Congo y Austronesio son los dos más grandes desde esta perspectiva, cada uno con más de 1000 idiomas debido a la increíble diversidad de idiomas en el África subsahariana y el sudeste asiático, respectivamente.
Estas seis familias también constituyen cinco sextos de la población mundial. Según el número de hablantes, el indoeuropeo y el chino-tibetano son las dos familias lingüísticas más grandes, con más de 4600 millones de hablantes entre ellas. Los dos idiomas más hablados pertenecen a estas familias: el inglés se clasifica como indoeuropeo y el chino mandarín se clasifica como chino-tibetano.