Jupyter Notebook [De Cero A Heroe] 1...

Iniciado por Andrey, Julio 16, 2018, 12:37:59 AM

Tema anterior - Siguiente tema

0 Miembros y 1 Visitante están viendo este tema.

Julio 16, 2018, 12:37:59 AM Ultima modificación: Julio 16, 2018, 12:43:53 AM por Andrey

El cuaderno Jupyter es una herramienta poderosa para desarrollar y presentar proyectos de manera interactiva. Un bloc de notas integra el código y su salida en un único documento que combina visualizaciones, texto narrativo, ecuaciones matemáticas y otros medios. El flujo de trabajo intuitivo promueve el desarrollo iterativo y rápido, convirtiendo a los portátiles en una opción cada vez más popular en el corazón de la ciencia de datos contemporánea, el análisis y, cada vez más, la ciencia en general. Lo mejor de todo es que, como parte del proyecto de código abierto Jupyter (No tienes permitido ver los links. Registrarse o Entrar a mi cuenta), son completamente gratuitos.

El proyecto Jupyter es el sucesor del anterior IPython Notebook, que se publicó por primera vez como prototipo en 2010. Aunque es posible utilizar muchos lenguajes de programación diferentes en Jupyter Notebooks, aquí nos centraremos en Python, ya que es el caso de uso más común.

Para aprovechar al máximo este tutorial, debe estar familiarizado con la programación, específicamente con Python y pandas (No tienes permitido ver los links. Registrarse o Entrar a mi cuenta) específicamente. Dicho esto, si tiene experiencia con otro idioma, el Python en este artículo no debería ser demasiado críptico y los pandas deberían ser interpretables. Jupyter Notebooks también puede actuar como una plataforma flexible para hacer frente a los pandas e incluso Python, como se hará evidente en este artículo.

Lo que intentaremos hacer:

Ver los conceptos básicos de la instalación de Jupyter y la creación de si primer notebook
Profundiza y aprende toda la terminología importante
Explorar qué tan fácilmente los cuadernos se pueden compartir y publicar en línea.


Instalación

La manera más fácil para que un principiante comience con Jupyter Notebooks es instalando Anaconda (No tienes permitido ver los links. Registrarse o Entrar a mi cuenta). Anaconda es la distribución de Python más utilizada para la ciencia de datos y viene precargada con todas las bibliotecas y herramientas más populares. Además de Jupyter, algunas de las mayores bibliotecas de Python incluidas en Anaconda incluyen NumPy (No tienes permitido ver los links. Registrarse o Entrar a mi cuenta), Pandas (No tienes permitido ver los links. Registrarse o Entrar a mi cuenta) y Matplotlib (No tienes permitido ver los links. Registrarse o Entrar a mi cuenta), aunque la lista completa excede las 1000 (No tienes permitido ver los links. Registrarse o Entrar a mi cuenta). Esto le permite iniciarse en su propio taller de ciencia de datos completamente equipado sin la molestia de administrar innumerables instalaciones o preocuparse por dependencias y problemas de instalación específicos del sistema operativo.


Para obtener Anaconda, simplemente:

Descargue (No tienes permitido ver los links. Registrarse o Entrar a mi cuenta) la última versión de Anaconda para Python 3 (ignore Python 2.7).
Instale Anaconda siguiendo las instrucciones en la página de descarga y / o en el ejecutable.
Si eres un usuario más avanzado con Python ya instalado y prefieres administrar tus paquetes manualmente, puedes usar pip:

Código: php
$ pip3 install jupyter



Creando el primer cuaderno

En esta sección, vamos a ver cómo ejecutar y guardar notebooks, familiarizarnos con su estructura y comprender la interfaz. Intentaremos utilizar la terminología básica que guiará hacia una comprensión práctica de cómo usar Jupyter Notebooks por si solo y nos preparará para la próxima sección, que pasa por un análisis de datos de ejemplo.


Ejecutando Jupyter

En Windows, puede ejecutar Jupyter través del acceso directo "Anaconda" que se añadio a su menú de inicio, que se abrirá una nueva pestaña en el navegador web por defecto que debe parecerse a la siguiente captura de pantalla.



Este no es un cuaderno todavía, No falta mucho para eso. Este es el tablero de instrumentos del Notebook, específicamente diseñado para administrar sus portátiles Jupyter. Piense en esto como el explorador para editar y crear cuadernos.

Tenga en cuenta que el tablero de instrumentos dará acceso solo a los archivos y subcarpetas contenidos en el directorio de inicio de Jupyter, sin embargo el directorio de inicio puede ser cambiado (No tienes permitido ver los links. Registrarse o Entrar a mi cuenta). También es posible iniciar el tablero en cualquier sistema mediante el símbolo del sistema (o terminal en sistemas Unix) al ingresar el comando "Jupyter Notebook", en este caso, el directorio de trabajo actual será el directorio de inicio.

Alguien observador puede haber notado que la URL en el tablero es algo así como No tienes permitido ver los links. Registrarse o Entrar a mi cuenta. Localhost no es un sitio web, indica que el contenido está sirviendo desde su máquina local, su propia computadora. Los cuadernos y el tablero de Jupyter son aplicaciones web y Jupyter inicia un servidor Python local para que sirva estas aplicaciones a su navegador web, lo que lo hace esencialmente independiente de la plataforma y abre la puerta a un intercambio más fácil en la web.

La interfaz del tablero de instrumentos es fácil de entender, aunque hablaremos sobre ello más adelante. Busque la carpeta en la que desea crear su primer bloc de notas, haga clic en el botón desplegable "Nuevo" en la esquina superior derecha y seleccione "Python 3" (o la versión que elija).



Su primer Jupyter Notebook se abrirá en una nueva pestaña, cada computadora portátil usa su propia pestaña porque puede abrir múltiples computadoras portátiles simultáneamente. Si vuelve al panel, verá el nuevo archivo "Untitled.ipynb" y verá un texto verde que le indica que su notebook está ejecutándose.


¿Qué es un archivo ipynb?

Será útil entender qué es realmente este archivo. Cada ".ipynb" es un archivo de texto que describe el contenido de su notebook en un formato llamado JSON (No tienes permitido ver los links. Registrarse o Entrar a mi cuenta). Cada celda y su contenido, incluidos los archivos adjuntos de imágenes que se han convertido en cadenas de texto, se enumeran junto con algunos metadatos (No tienes permitido ver los links. Registrarse o Entrar a mi cuenta). Puede editar esto usted mismo, claro si sabe lo que está haciendo, seleccionando "Editar> Editar metadatos del cuaderno" de la barra de menú en el cuaderno.

También puede ver el contenido de los archivos de su computadora portátil seleccionando "Editar" desde los controles en el tablero, pero la palabra clave aquí es "puede", no hay otra razón más que la curiosidad para hacerlo, a menos que realmente sepas lo que estás haciendo.

La interfaz del notebook

Ahora que tiene un cuaderno abierto, su interfaz no se verá extrañamente ajena, después de todo Jupyter es esencialmente solo un procesador de textos avanzado. Consulte los menús para familiarizarse con ellos, especialmente tómese unos minutos para desplazarse por la lista de comandos en la paleta de comandos, que es el botón pequeño con el ícono del teclado (o Ctrl + Shift + P).



Hay dos términos bastante importantes que debe observar, que probablemente sean nuevos para usted: las células y los núcleos son clave tanto para comprender a Jupyter como para lo que lo convierte en algo más que un procesador de textos. Por suerte estos conceptos no son difíciles de entender.

Un kernel es un "motor computacional" que ejecuta el código contenido en un documento de cuaderno.
Una celda es un contenedor para que el texto se muestre en el cuaderno o código para ser ejecutado por el kernel de la computadora portátil (Notebook).

Células

Hablaremos de los núcleos más adelante, pero primero veamos las células. Las células forman el cuerpo de un cuaderno. En la captura de pantalla de un nuevo cuaderno en la sección anterior, ese cuadro con el contorno azul es una celda vacía. Hay dos tipos de células principales que trataremos:

Una celda de código contiene el código que se ejecutará en el kernel y enseguida muestra su resultado.
Una celda de Markdown contiene texto formateado usando Markdown y muestra su resultado en el lugar cuando se ejecuta.
La primera celda de una nueva computadora portátil siempre es una celda de código. Probémoslo con un clásico ejemplo de Hola mundo. Escriba print('Hola mundo!') en la celda y haga clic en el botón Ejecutar en la barra de herramientas de arriba o presione Ctrl + Enter.


El resultado debería verse así:

Código: php
1 print ( ' Hola mundo! ' )


Hola mundo!





Jupyter Notebook De Cero A Heroe [2]
No tienes permitido ver los links. Registrarse o Entrar a mi cuenta




Andrey...


"Es un mundo brutal y peligroso el que hay allá afuera... Pero encontré mi camino. El caos es mi hogar, y me aseguraré de que no escapes de el"...

"Solo se necesita una excusa para cambiar el mundo"