Crear una frase variable que contiene una lista de palabras. Revisar las operaciones descritas en el capítulo anterior, incluyendo además, la multiplicación, la indexación, corte en rodajas, y la clasificación.
Enviado por Christopher • 15 de Abril de 2018 • 1.099 Palabras (5 Páginas) • 474 Visitas
...
Tratar de explicarlas en términos de su propia comprensión impresionista de los diferentes géneros. ¿Puede encontrar otras clases cerradas de palabras que muestran diferencias significativas entre los diferentes géneros?
12. El Diccionario de la pronunciación de CMU contiene varias pronunciaciones para ciertas palabras. ¿Cuántas palabras distinta contiene? ¿Quéfracción de las palabras en este diccionario tienen más de una pronunciación posible?
13. ¿Qué porcentaje de Synsets nominales no tienen hipónimos? Usted puede obtener todo Synsets sustantivo usando wn.all_synsets ( ’norte’).
14. Definir un Supergloss (s) función que toma un synset s como su argumento y devuelve una cadena que consiste en la concatenación de la definición de s, y las definiciones de todos los hiperónimos y hipónimos de s.
15. Escribir un programa para encontrar todas las palabras que se producen al menos tres veces en el Brown Corpus.
16. Escribir un programa para generar una tabla de puntuaciones de diversidad léxica (es decir, relaciones simbólicas / tipo), como vimos en el Incluir la totalidad de los géneros de Brown Corpus (nltk.corpus.brown.categories ()). ¿Qué género tiene la diversidad más baja (mayor número de fichas de cada tipo)? Es esto lo que habría esperado?
17. Escribir una función que encuentra las 50 palabras más frecuentes de un texto que no son palabras vacías.
18. Escribir un programa para imprimir las 50 Bigramas más frecuentes (pares de palabras adyacentes) de un texto, omitiendo Bigramas que contienen palabras vacías.
19. Escribir un programa para crear una tabla de frecuencias de palabras de género, como la que se da en 1de modales. Elija sus propias palabras y
20. tratar de encontrar las palabras cuya presencia (o ausencia) es típico de un género. Discutir sus hallazgos. Escribe una word_freq función () que toma una palabra y el nombre de una sección del Corpus Brown como argumentos, y calcula la frecuencia de la palabra en esa sección del corpus.
21. Escribir un programa para adivinar el número de sílabas contenidas en un texto, haciendo uso del diccionario pronunciando CMU.
22. Definir una cobertura función (texto) que procesa un texto y produce una nueva versión con la palabra ’me gusta’entre cada tres palabras.
23. La ley de Z:i pDfejar f (w)ser la frecuencia de una palabra wen texto libre. Supongamos que todas las palabras de un texto son clasificados en función de su frecuencia, con la palabra más frecuente en primer lugar. la ley de Zipf establece que la frecuencia de un tipo de palabra es inversamente proporcional a su rango (es decir,F× r = k, Para alguna constante k). Por ejemplo, el 50a más común tipo de palabra debe ocurrir tres veces tan frecuentemente como la 150a tipo de palabra más común.
1. Escribir una función para procesar un texto y parcela grande de frecuencia de palabras contra el rango de palabra con el pylab.plot. Cómo se confirma la ley de Zipf? (Pista: ayuda a utilizar una escala logarítmica). ¿Qué está pasando en los extremos de la línea trazada?
2. Generar texto al azar, por ejemplo, usando random.choice ( "Abcdefg"), Teniendo cuidado de incluir el espacio personaje. Necesitaras importar azar primero. Utilice el operador de concatenación de cadenas deacumular caracteres en una cadena (muy) largo. Entonces tokenizar esta cadena, y generar la trama Zipf como antes, y comparar las dos parcelas. ¿Qué opina de la ley de Zipf a la luz de esto?
24. Asdasd
25. Definir una función find_language () que toma una cadena como argumento, y devuelve una lista de los idiomas que tienen esa cadena como una palabra. Utilice el corpus DUDH y limitar las búsquedas a los archivos de la codificación Latin-1.
26. ¿Cuál es el factor de ramificación de la jerarquía sustantivo hypernym? Es decir, para cada synset sustantivo que tiene hipónimos - O niños en la jerarquía hypernym - cuántos Qué tienen en promedio? Usted puede obtener todo Synsets sustantivo usando wn.all_synsets ( ’norte’).
...