Microsoft R
- Jose A. Esteban
- Dec 6, 2016
- 3 min read

Que R es una de las soluciones más potentes y más implantadas como lenguaje de programación, estadístico, machine learning y visualización; soportado por una amplia comunidad de usuarios, no es nada nuevo. Lo que puede resultarle nuevo a los que conocen poco a Microsoft, o a la nueva Open Microsoft, es que Microsoft soporte y promueva esta solución.
Microsoft ha sacado una familia de productos para soportar R en un entorno empresarial.
Microsoft R Server.
Este producto permite la ejecución de scripts de R en servidores aprovechando su capacidad de computo.
Microosft R Server for Haadop. Permite utilizar toda la potencia de HDFS, para realizar procesamiento paralelo en múltiples nodos sin necesidad de llegar a programas aplicaciones MapReduce. Además incluye soporte para Spark esto significa que utilizando Azure en 30 minutos podemos tener un entorno completo para analizar Tb de información sin tener que llamar a ningún responsable de TI.
Micosoft R Server for TeraData DB. Una aproximación distinta es permitir que sea TeraData DB la que realice los proceso de los scripts de R, esta opción permite que las inversiones realizadas en TeraData, que suelen ser "Big" de verdad, sean utilizadas ahora por más usuarios a través de R. Microsoft R Server for Linux. Esta es la opción que resume la escalabilidad en "si no funciona ponlo en una máquina más grande" diseñada para liberar a los Data Science de las limitaciones de sus estaciones de trabajo permitiendo la ejecución en servidores.
Microsoft R Client.
Esta aplicación es un GUI para la creación y ejecución de scripts R que permite a los usuarios tener un entorno completo de trabajo, no la voy a comparar con RStudio u otras soluciones, para gustos están los colores, pero lo que si resulta mucho más interesante son los paquetes de R Client para Visual Studio, aquí estamos hablando de un IDE de verdad que conectado a Team Fundation Service nos permite tener un entorno de desarrollo de aplicaciones verdaderamente profesional, con control de versiones, releases, compilaciones (los que compilen), despliegues, etc. vamos todas esas características que los programadores caseros nunca encuentran útiles y que para los que hacemos aplicaciones para clientes son lo único que evita el suicidio colectivo. Tranquilo si no has entendido esta referencia.
Microsoft R Open.
¿Quien dijo que Microsoft solo vende licencias? Aquí tenéis la distribución Open Source de Microsoft para R, que promete mejor rendimiento y compatibilidad total con los paquetes de otras distribuciones open source, lo que si promete y es mucho más seguro es la compatibilidad total y la integración total con R Server.
En el sitio web MRAN tenéis toda la información y podéis descargarla.
SQL Server R Services
La guinda del pastel es la solución completa que unifica datos y capacidad de análisis, si ya la versión de SQL Server 2008 permitía realizar algoritmos de Data Mining, con este producto podemos ejecutar scripts de R directamente sobre nuestro SQL Server eso sí versión 2016.
Sinceramente creo que esta a esta familia de productos solo le queda "Microsoft R Pluging for Excel" para terminar ayudarnos a crear verdaderos Data Science, personas que tienes conocimientos analíticos y de arquitectura suficientes para analizar grandes volúmenes de información en tiempos razonables.
Hasta ahora me resistía a darles el nombre de Data Science a los usuarios de RStudio en su pc con unos megas de información, pero quizá simplemente conectando Microsoft R Client a Microsoft R Server for Haddoop ese mismo script funcione para Terabytes de información y ellos mismos sean merecedores del nombre.
Todavía es pronto para saberlo pero quizá estemos a punto de ver una transformación parecida al cambio de WordPerfect a Word y Microsoft esté en camino de simplificar los entornos para que al final sean los análisis los que proporcionen valor sin necesidad de distraernos con los entornos.
Esto también cambia nuestra oferta académica y en Master de Data Science para profesionales incluiremos la visión de todo el entorno Microsoft para R, además estamos preparando un curso monográfico que espero que en Octubre esté disponible.
Comments