La importancia de Cyber Security Data Science

30/09/2020 29

Han pasado ya unos años desde aquella frase en un artículo de Economist que decía “el recurso más valioso del mundo ya no es el petróleo, sino los datos”, aunque esta idea ya había sido acuñada en 2006 por un célebre matemático. Todas las compañías tecnológicas lideran la utilización de estos datos, y a su vez, disciplinas como la IA (Inteligencia Artificial) son capaces de transformar esos datos en bruto en información.

La IA aprende de los datos y se utiliza de manera transversal en áreas como la medicina, marketing, predicción de la demanda eléctrica, recomendaciones de compra o la asignación de las rutas más eficientes de transporte, etc.

El cibercrimen puede causar efectos devastadores en cuanto a pérdidas financieras se refiere, afectando a compañías e individuos. En un informe reciente de Juniper Research se estima que el coste producido por los ataques que producen una brecha de seguridad es de casi 4 millones de dólares de media en Estados Unidos y que el coste para la economía global es de alrededor de 400 billones de dólares. Se estima que en  2024 este coste llegue a los 3 trillones de dólares, con una media de crecimiento anual del 11%.

La ciberseguridad es un conjunto de tecnologías y procesos diseñados para proteger los ordenadores, la red, los programas y los datos de ataques, daños o accesos no autorizados. Las herramientas tradicionales como antivirus, firewalls, control de accesos y criptografía puede que no sean suficientes, teniendo en cuenta las necesidades actuales de la industria. Aunque todas estas técnicas siguen funcionando, necesitan en la mayoría de los casos mucho trabajo manual, teniendo en cuenta el cambiante ciberespacio, donde cada día hay nuevas amenazas de seguridad.

Por el contrario,  Data Science está  proporcionando el cambio necesario para mejorar estas operaciones. Se pueden utilizar los algoritmos de Machine Learning para aprender o extraer información de los datos o encontrar  patrones de incidentes de seguridad y prevenirlos. Por ejemplo, detectar de manera automática un malware o una tendencia sospechosa, alertar al operador de ciberseguridad y reaccionar en segundos.

How cybersecurity leaders are overcoming the new risk landscape

Vivimos en la era de los datos y en la toma de decisiones basada en los datos. Data Science  ha surgido en los últimos años como un nuevo campo de la ciencia enfocado en entender los datos. Hay aún mucho debate acerca de Big Data y Data Science, pero en lo que todos parecen estar de acuerdo es que Data Science ha surgido como un nuevo campo interdisciplinario y transversal, con disciplinas como la estadística, la Inteligencia Artificial, la computación, pero también la gestión de negocio.

La ciberseguridad es un conjunto de tecnologías y procesos diseñados para proteger los ordenadores, la red, los programas y los datos de ataques, daños o accesos no autorizados.

Muchos investigadores utilizan el término Data Science para describir el campo interdisciplinario que sintetiza y se basa en las estadística, informática, Machine Learning, computación, comunicación, gestión y sociología para estudiar los datos y sus entornos. De esta manera se pueden transformar los datos en conocimiento y esto permite una mejor toma de decisiones.

Basándonos en la gran capacidad analítica de Data Science, incluyendo las técnicas de Machine Learning, se puede proporcionar una ventaja competitiva a las técnicas  tradicionales de ciberseguridad. Siendo capaces de entender los problemas, recopilar los datos de seguridad de distintas fuentes, preparar los datos para alimentar los modelos, construir  y actualizar los modelos basados en datos, en definitiva  proporcionar servicios de seguridad inteligentes.

Generalmente en el campo de la ciberseguridad, se usaban las técnicas tradicionales para detectar amenazas, como hashes de ficheros, reglas escritas a medida como firmas u otro tipo de técnicas tradicionales de seguridad. Pero si pensamos en ciberseguridad como un “gran proveedor de datos”, se puede aplicar Data Science para acelerar el análisis, detección y prevención de las amenazas. De ahí surge el concepto de Cyber Security Data Science.

El concepto Cyber Security Data Science incorpora la metodología y la técnicas de Data Science y Machine Learning así como el análisis del comportamiento de distintos incidentes de seguridad. Este concepto se refiere a recolectar gran cantidad de datos de muy diversas fuentes, analizar la información usando las tecnologías de Machine Learning para detectar riesgos de seguridad y/o ataques mediante el descubrimiento de información útil o la obtención de patrones basados en datos. No quiere decir que con estas tecnologías no necesitaremos a los expertos en seguridad, sino que una vez más, la IA con foco en Machine Learning, va a contribuir a proporcionar lo que llamamos “inteligencia aumentada”. Cyber Security Data Science tiene la capacidad de proporcionar a los analistas de seguridad, una herramienta para hacer más efectivo y rápido su trabajo.

Se puede proporcionar una ventaja competitiva a las técnicas  tradicionales de ciberseguridad.

En la actualidad la mayoría de las empresas con productos de ciberseguridad, incorporan ya técnicas de data science. Así mismo, se abren oportunidades nuevas para el trabajo conjunto de los analistas de seguridad y los expertos en Data Science o Machine Learning. Actualmente en España, en el reciente informe EPyCE 2019 elaborado por la asociación española de directores de RRHH y la colaboración de varias consultoras, muestra al científico de datos y el experto en seguridad entre las profesiones más demandadas.