Inicio de proyecto
Analisis de impacto sobre el servicio de TI
Evaluacion de Riesgos
Definicion de roles y responsabilidades
Pruebas del Plan
Fin del DRP
Coordinador DRP
Equipo de Respuesta a Emergencias
Equipo de Salvamento de Hardware
Equipo de Recuperación de Servidores
Equipo de Recuperación de Redes
Equipo de Recuperación de Aplicaciones
Equipo de Recuperación de Base de Datos
Equipo de Recuperación de Almacenamiento
DRP- Disaster Recovery PlanDRP- Disaster Recovery Plan
DRP- Disaster Recovery Plan
DRP- Disaster Recovery Plan
2121
21
21
11
1
1
Coordinador DRP
Equipo de Salvamento de Hardware
Equipo de Recuperación de Servidores
Equipo de Recuperación de Redes
Equipo de Recuperación de Aplicaciones
Equipo de Recuperación de Base de Datos
Equipo de Recuperación de Almacenamiento
Equipo de Respuesta a Emergencias
CatedraticoIng. Walter Colón CatedraticoIng. Walter Colón AUDITORIA DE SISTEMAS 2013 AUDITORIA DE SISTEMAS 2013DRP
Catedratico
Ing. Walter Colón
Catedratico
Ing. Walter Colón
AUDITORIA DE SISTEMAS 2013
AUDITORIA DE SISTEMAS 2013
DISASTER RECOVERY PLAN
INTEGRANTES
ADRIANA GABRIELA CASTRO GIRON
JULIO ALBERTO MARTINEZ CABRERA
DAVID JONATHAN MENJIVAR
JAIME ALFREDO AVILES FERMAN
DANIEL RAUL HERNANDEZ MIRAFLORES
Contenido
INTRODUCCION 4
DEFINICION 5
OBJETIVOS DEL DRP 6
CARACTERÍSTICAS DE UN DRP 7
BENEFICIOS DRP 7
RELACIÓN DRP CON EL BCP 8
DIFERENCIAS CON EL BCP 9
EJEMPLOS DE DESASTRES O CASOS 10
VENTAJAS Y DESVENTAJAS DRP 12
RESPONSABILIDADES DEL DRP 13
PROYECTAR CON COBIT E ITIL EL DRP 14
DRI 20
¿CÓMO ELABORAR UN DRP? 21
EJEMPLO DE UN DRP 25
ERRORES AL ELABORAR DRP 28
CONCLUSIÓN 30
BIBLIOGRAFIA 31
INTRODUCCION
No se trata de conceptos o procesos complejos. De hecho, el legendario boxeador Muhammad Ali era un experto en esta materia y lo explicó con palabras simples. Ante cualquier situación crítica o una aparente derrota, el célebre deportista decía: "Dentro y fuera del ring, no tiene nada de malo caer, lo malo es quedarse abajo".
Imaginemos. ¿Cuál sería el impacto para una organización financiera si la aplicación de banca electrónica o los cajeros "se cayeran" un día de "quincena"? ¿Cómo se dañaría la reputación de una empresa de transportes si su sistema de venta de boletos "se cayera" un día antes del regreso a clases? ¿Cuánto dinero podría perder una cadena de autoservicio por cada 10 minutos que la infraestructura de su Punto de Venta "se cae"?
Para iniciar, es fundamental analizar cuál es la tolerancia del negocio a la no disponibilidad de las funciones críticas. Es decir, qué pasa si dejo de operar una hora, un día o un tiempo determinado. Después, se debe observar cuál es la probabilidad real de enfrentar una contingencia, y cómo impactará al negocio, clientes, empleados, proveedores y/o accionistas.
Finalmente, con esta información, precisar el costo de contar con una solución que maximice las posibilidades de restablecer la operación, con su respectiva promesa de disponibilidad.
DEFINICION
Un plan de recuperación ante desastres (DRP) es un proceso documentado o conjunto de procedimientos para recuperar y proteger la infraestructura tecnológica de una empresa en caso de un desastre.
Llamamos desastre a cualquier causa que afecte a esta infraestructura (datos, hardware o software) ya sea natural, intencional o involuntario, e impida la continuidad del negocio.
Dada la creciente dependencia de las empresas a la tecnología de la información para dirigir sus operaciones, un plan de contingencias, así como un plan de recuperación de desastres cobra cada día más relevancia, y por lo tanto, es indispensable que toda empresa disponga de él. Según IBM de las empresas que han tenido una pérdida principal de registros automatizados, el 43 % nunca vuelve a abrir, el 51 % cierra en menos de dos años y sólo el 6 % sobrevivirá a largo plazo.
La recuperación de la infraestructura de TI en caso de desastres tales como huracanes, terremotos e inundaciones o sobre aquellos causados de manera deliberada por el hombre (ataques de virus, Explosiones, incendios, sabotaje) ha cobrado particular relevancia. Cada organización debe estar preparada para reaccionar ante una posible interrupción. Las caídas en los centros de cómputo afectan a la organización entera impactando las actividades internas e implicando una enorme pérdida de ingresos. Externamente, la imagen pública y las relaciones con los clientes y vendedores son puestas en riesgo seriamente.
OBJETIVOS DEL DRP
La Dirección de la empresa debe tomar la decisión de emprender el plan como un proyecto para así satisfacer los siguientes objetivos:
Determinar la vulnerabilidad a las interrupciones del servicio importantes en el centro de datos e instalaciones de negocios y definir las medidas preventivas que se pueden tomar para reducir al mínimo la probabilidad y el impacto de las interrupciones.
Identificar y analizar el coste, servicio, la imagen pública y otras consecuencias de las interrupciones prolongadas del servicio en el centro de datos y otras instalaciones empresariales.
Determinar las necesidades inmediatas, a medio y largo plazo, de recuperación y los recursos necesarios.
Identificar las alternativas y seleccionar los métodos más rentables para proporcionar la función de las operaciones de copia de seguridad y la restauración de un servicio a tiempo.
Desarrollar e implementar planes de contingencia que se ocupan de las necesidades inmediatas y de largo plazo para el centro de datos y otros servicios empresariales.
Proteger la organización: protección de las instalaciones y recursos del centro de datos para asegurar la estabilidad de la organización.
CARACTERÍSTICAS DE UN DRP
Es crítico tener un programa de Continuidad de Negocios y Recuperación ante Desastres que, al menos, cuente con las siguientes características:
Infalible: Que cuente con una correcta planeación, una profunda administración del cambio de tecnología, y que sea probado de forma constante.
Automatizado: En caso de desastre, difícilmente se puede acceder a las instalaciones, la infraestructura tecnológica podría no estar disponible y el personal clave podría o no estar en condiciones de operar. De ahí la importancia de mantener un respaldo y automatización de los procesos desde otra sede y con equipo preparado.
Fácil de justificar: Estas soluciones no sólo son redituables cuando existe una contingencia. Además de reducir los riesgos ante un desastre, fortalecen la operación diaria y optimizan procesos existentes.
BENEFICIOS DRP
El resultado de la implementación de un DRP es poder contar con un plan de contingencia que incluye las responsabilidades y facultades detalladas de los miembros del equipo de recuperación de desastres. Un DRP establece una guía y provee la certeza razonable de que los recursos y las instalaciones críticas de TI permanecerán disponibles en caso de un desastre.
Protección de la organización.
Minimiza el riesgo de demoras
Minimizan la toma de decisiones durante un desastre: Durante una situación de desastre altamente estresante, la toma de decisiones críticas llega a ser exponencialmente más compleja como resultado directo del corto período disponible para reaccionar.
Provee un sentido de seguridad: El conocimiento y la certeza de que se cuenta con alternativas para la continuación de las operaciones trasmite confianza a los empleados, al equipo de administración, a los clientes, a los aseguradores así como a los inversionistas.
Proveer un sentido de seguridad: El conocimiento y la certeza de que se cuenta con alternativas para la continuación de las operaciones trasmite confianza a los empleados, al equipo de administración, a los clientes, a los aseguradores así como a los inversionistas.
Disminuye los tiempos de indisponibilidad
RELACIÓN DRP CON EL BCP
El plan de recuperación de desastres se relaciona directamente con el BCP llamado Plan de Continuidad de Negocio o Business Continuity Plan, el DRP está incluido dentro de un plan integral de organización de empresa (BCP) que incluye los siguientes componentes principales:
Plan de reanudación de negocios
Plan de emergencia del personal
Plan de continuidad de operaciones
Plan de manejo de incidentes
Plan de recuperación de desastres
Podemos observar que el DRP es el último eslabón de un plan integral de una organización o empresa que como objetivo principal tiene salvaguardar su activo o su recurso más preciado que es la infraestructura tecnológica.
DIFERENCIAS CON EL BCP
DRP
BCP
El DRP, Disaster Recovery
Plan plantea:
Realizar planes de prevención y recuperación antes los escenarios de desastre con mayor impacto y probabilidad de ocurrencia.
El ámbito del DRP son los sistemas de información de la organización.
Dentro de los DRP son críticos los tiempos de pérdida y recuperación de información.
A diferencia del BCP que protege contra problemas de hardware, el DRP protege contra desastres exteriores.
El BCP, Business Continuity Plan extiende el alcance:
El BCP tiene como objetivo el mantenimiento de la actividad de la empresa, bien mediante la recuperación de los procesos de soporte o mediante la aplicación de procesos de emergencia.
Dentro del BCP es clave el BIA,
que tiene en cuenta el impacto económico de una parada de la actividad.
El Plan de continuidad del negocio (BCP) es el último eslabón de la cadena y se aplica únicamente para proteger las aplicaciones que son vitales para la actividad de la empresa.
EJEMPLOS DE DESASTRES O CASOS
Incendio en el edificio Windsor de Madrid, 12 de febrero de 2005Incendio en el edificio Windsor de Madrid, 12 de febrero de 2005
Incendio en el edificio Windsor de Madrid, 12 de febrero de 2005
Incendio en el edificio Windsor de Madrid, 12 de febrero de 2005
SONY
Inundacion de Tailandia año 2011Inundacion de Tailandia año 2011
Inundacion de Tailandia año 2011
Inundacion de Tailandia año 2011
WESTERN DIGITAL
Western Digital, fabricante de discos duros paraliza su producción.Western Digital, fabricante de discos duros paraliza su producción.
Western Digital, fabricante de discos duros paraliza su producción.
Western Digital, fabricante de discos duros paraliza su producción.
VERIZON
Impacto en Verizon CommunicationsImpacto en Verizon Communications
Impacto en Verizon Communications
Impacto en Verizon Communications
Principales daños:
5 conmutadores de telecomunicación
10 torres del sistema de telefonía celular
300.000 líneas de voz
3.6 millones de circuitos ubicados en el área
Los centros de conmutación de A&T y Sprint en el WTC fueron destruidos.
Medidas adoptadas por Verizon
6 torres de celular temporales preparadas (3 fuera del área de Manhattan).
1 conmutador móvil preparado.
Trabajos con proveedores de larga distancia para reenrutar el trafico
Contactos con sus proveedores principales para el despacho de equipos críticos (conmutadores, fibra óptica, etc.).
Importancia de la Ejecución del DRP luego del desastre:
2 semanas después:
70% de la capacidad restaurada.
Transferencia de llamadas activas para mediados de esa semana.
3 semanas después:
80% de la capacidad nuevamente en servicio
Virtualmente todos los servicios han sido restaurados hasta la fecha.
VENTAJAS Y DESVENTAJAS DRP
Ventajas
Asegurar el futuro de la empresa. Existen estudios que demuestran que tras sufrir una pérdida importante de información, las empresas quiebran en un tiempo promedio de tres años si no existe un DRP.
Aumentar el nivel de disponibilidad: Al implementar el DRP se pueden mantener los servicios en un menor tiempo.
Mantener su reputación. Al continuar casi ininterrumpidamente con las actividades, sus clientes reconocerán en su empresa valores como el compromiso y la responsabilidad, lo que les dará la confianza de continuar adquiriendo sus servicios.
Un factor muy importante al implementar el DRP y el BCP es su constante actualización, la cual debe ir a la par de la detección de nuevas amenazas, cambios en la estrategia de negocios, creación o eliminación de áreas dentro de su empresa, etc.
Desventajas
Requiere una planeación muy detallada.
Puede tomar mucho tiempo la elaboración del DRP.
El costo puede ser elevado
Requiere la participación de todas las personas dentro de la empresa.
Las personas pueden creer que es innecesario, debido a que todavía no ha ocurrido un desastre.
RESPONSABILIDADES DEL DRP
DRP, ITCP, CIRP – El área de Sistema
Considerar a toda la organización, no sólo a la TI
Responsabilidad de ALTA GERENCIA (Salvaguarda activos y viabilidad de empresa)
Responsables de recursos críticos son quienes reaccionarán ante un desastre mientras se lleva a cabo la recuperación
Participación de Gerencia y Usuarios Vital para éxito del plan
Gerencia Usuarios identificará procesos, tiempos críticos de recuperación y recursos necesarios para recuperación.
PROYECTAR CON COBIT E ITIL EL DRP
Un aspecto clave en la gestión de la continuidad del negocio (BC) y la recuperación ante desastres (DR) es la medición del rendimiento. Se presenta el uso de métricas y se examina cómo la recuperación ante desastres puede ser diseñada a través de dos marcos de referencia ampliamente utilizados: la Biblioteca de Infraestructura de Tecnologías de la Información (ITIL -Information Technology Information Library) versión 3 y los Objetivos de Control para la Información y Tecnologías relacionadas (COBIT - Control Objectives for Information and related Technology). Estos dos marcos de referencia proporcionan controles medibles que se pueden aplicar a los procesos de recuperación ante desastres de los Sistemas de Información (TI). ¿Por qué es importante? Dando por hecho que usted quiere diseñar unos planes de recuperación ante desastres que sean compatibles con los estándares y controles aceptados por la industria, estos dos marcos proporcionan unos sólidos puntos de partida
ITIL Versión 3
ITIL V3 es un marco para la gestión de servicios de TI que se ocupa de la planificación, aprovisionamiento, diseño, implementación, operación, soporte y mejora de los servicios de TI que sean adecuados para las necesidades del negocio. ITIL proporciona un marco integral, consistente y coherente de buenas prácticas en la gestión de los servicios de TI y otros procesos relacionados. ITIL también promueve un enfoque de alta calidad para el logro de la eficacia empresarial y la eficiencia en la gestión de los servicios de TI. Desarrollado en el Reino Unido por la Oficina de Comercio del Gobierno (Office of Government Commerce - OGC), el marco de trabajo ITIL describe los métodos, funciones, roles y procesos sobre los que las organizaciones pueden desarrollar y evaluar sus propias actividades de TI.
Diseño de la Recuperación ante Desastres de TI con COBIT e ITIL
El proceso de recuperación ante desastres de TI está bastante bien definido.
COBIT e ITIL describen "qué" hay que hacer, pero no "cómo" hacerlo. Usted puede utilizar los marcos como una lista de comprobación para asegurarse de que no ha omitido ninguna de las actividades principales.
Mapa detallado de Recuperación ante Desastres con COBIT e ITIL
Actividades de Recuperación ante Desastres de TI
COBIT
ITIL
Objetivo del control
Denominación
Objetivo del control
Denominación
Enfoque consistente y global de la administración de la continuidad de TI
DS4.1
Marco de trabajo de continuidad de TI
SD 4.5
SD 4.5.5.1
CSI 5.6.3
Administración de la continuidad del servicio TI
Etapa 1: Inicio
Administración de la continuidad del servicio TI
Planes individuales de continuidad basados en el marco de trabajo
Análisis de la incidencia en el negocio
Resistencia, procesamiento alternativo y recuperación
DS4.2
Planes de continuidad de TI
SD 4.5.5.2
SD 4.5.5.3
Etapa 2:
Requerimientos y estrategia
Etapa 3:
Implementación
Enfoque sobre la infraestructura crítica, resistencia y priorización
Respuesta para diferentes periodos de tiempo
DS4.3
Recursos críticos de TI
SD 4.4.5.2
SD 4.5.5.4
Actividades de administración de la disponibilidad
Etapa 4: Operación en curso
Control de cambios que refleje los requerimientos actuales del negocio
DS4.4
Mantenimiento del plan de continuidad de TI
SD 4.5.5.4
Etapa 4: Operación en curso
Realización de pruebas con regularidad
Implementación de un plan de acción
DS4.5
Pruebas del Plan de continuidad de TI
SD 4.5.5.3
SD 4.5.5.4
Etapa 3:
Implementación
Etapa 4: Operación en curso
Capacitación regular de todas las partes interesadas
DS4.6
Ensayo del plan de continuidad de TI
SD 4.5.5.3
SD 4.5.5.4
Etapa 3:
Implementación
Etapa 4: Operación en curso
Distribución adecuada y segura del plan a todas las partes autorizadas
DS4.7
Distribución del plan de continuidad de TI
SD 4.5.5.3
SD 4.5.5.4
Etapa 3:
Implementación
Etapa 4:
Operación en curso
Plan de acción en períodos de recuperación y reanudación de los servicios TI
Comprender el negocio y apoyar las inversiones
DS4.8
Recuperación y reanudación de los servicios TI
SD 4.4.5.2
SD 4.5.5.4
Actividades de administración de la disponibilidad
Etapa 4: Operación en curso
Almacenamiento fuera de las instalaciones de todos los medios, documentos y recursos críticos necesarios en colaboración con los responsables de los procesos
DS4.9
Almacenamiento de copias de seguridad fuera de las instalaciones
SD 4.5.5.2
SO 5.2.3
Etapa 2:
Requerimientos y estrategia
Copia de seguridad y restauración
Evaluación regular de los planes
DS4.10
Revisión Post-reanudación
SD 4.5.5.3
SD 4.5.5.4
Etapa 3:
Implementación
Etapa 4:
Operación en curso
La figura muestra cómo se planifican algunas actividades de Recuperación ante Desastres de TI mediante COBIT e ITIL. Aunque el plan general de Recuperación ante Desastres de TI que uno puede desarrollar incluirá probablemente más puntos de los que aquí se indican, éstas constituyen unos sólidos fundamentos.
Por el contrario, si analizamos las previsiones de ITIL, vemos que ITIL avala un marco de trabajo denominado Gestión de la Continuidad del Servicio de TI (ITSCM TI Service Continuity Management). El ITSCM se ocupa de los riesgos que podrían causar un impacto repentino y grave en la infraestructura de TI, de manera que una interrupción de los mismos podría poner en peligro la continuidad del funcionamiento de la empresa. De acuerdo con ITIL, la ITSCM debe estar alineada con el ciclo de vida de continuidad del negocio. La ITSCM se centra en la protección de la infraestructura tecnológica, mientras que la continuidad del negocio se centra en los riesgos que podrían interrumpir las operaciones de negocio. Los puntos SD 4.5.5.3 y SD 4.5.5.4 se ocupan de los enfoques y de las actividades y técnicas que hacen posible la ITSCM. También describen las medidas de planificación, protección y optimización de las etapas 3 y 4, Implementación (SD 4.5.5.3) y Operación en curso (SD 4.5.5.4), del ciclo de vida de la ITSCM.
En este caso, las guías de COBIT y de ITIL pueden ser utilizadas como parte del proceso de prueba de recuperación ante desastres de TI. En el punto 4.1 de COBIT se dan detalles más específicos sobre los objetivos de una prueba. Por su parte, ITIL dibuja los procesos básicos de gestión sin entrar en detalles tan específicos. No obstante, en ambos casos las guías describen lo que se debe hacer, no cómo hacerlo.
BACKUPS
Más allá de los conceptos básicos, los mejores planes de recuperación de datos que consideren la necesidad de los backups son las siguientes:
Hot Sites
Un sitio caliente " proactivo " le permite mantener los servidores y un sitio de copia de seguridad en vivo y en funcionamiento en caso de un desastre. Básicamente, se duplica el entorno de producción en nuestro centro de datos. Esto permite un corte y cambio inmediato en caso de desastre en el sitio principal. Un sitio caliente es una necesidad para los sitios de misión crítica.
Warn Sites
Permite pre-instalar y pre-configurar sus necesidades de ancho de banda y hardware. Entonces, si ocurre un desastre, todo lo que tienes que hacer es cargar el software y los datos para restaurar los sistemas de negocio.
Cold Sites
La "recuperación " del sitio frío es esencialmente sólo el espacio del centro de datos, potencia y conectividad de red que está listo y esperando siempre que lo pueda necesitar. Si ocurre un desastre, nuestros ingenieros y equipos de apoyo logístico fácilmente pueden ayudar a mover el hardware en nuestro centro de datos y conseguir que vuelva a funcionar.
DRI
El DRI International (Disaster Recovery Institute) es un organismo sin fines de lucro fundado desde 1988 como el Instituto de Recuperación de Desastres con el fin de desarrollar una base de conocimientos en la planificación de contingencias y el manejo de riesgos, una profesión de rápido crecimiento. Administra los principales programas de certificación de la industria para aquellos comprometidos con la práctica de la planificación y administración de la Continuidad del Negocio.
Entre sus objetivos podemos mencionar los siguientes:
Promover un conocimiento común de la planificación de la Continuidad del Negocio / Recuperación de Desastres mediante la educación, asistencia y publicación del recurso estándar.
Certificar individuos calificados en la disciplina
Promover la credibilidad y el profesionalismo de las personas certificadas
El DRI International ofrece 5 niveles de certificación profesional, las cuáles son de reconocimiento mundial como el estándar para la excelencia en la gestión de la Continuidad del Negocio.
Associate Business Continuity Professional (ABCP)
Para individuos con menos de 2 años de experiencia en la industria pero con un mínimo de conocimiento en la gestión de la Continuidad del Negocio, que hayan pasado con éxito el examen de calificación.
Certified Business Continuity Vendor (CBCV)
Es la nueva certificación que ofrece el DRII. Se debe demostrar conocimiento en sus prácticas profesionales y tener más de 2 años de experiencia como vendedor en este campo. Master Business Continuity Professional (MBCP)
Es para profesionales con una vasta y demostrada experiencia en la gestión de la Continuidad del Negocio. Deben contar con un mínimo de cinco (5) años de experiencia como planificadores de la Continuidad del Negocio y demostrar experiencia práctica en 7 de las áreas principales de las 10 Mejores Prácticas Profesionales.
¿CÓMO ELABORAR UN DRP?
La metodología recomendada en este documento para el desarrollo de un plan de recuperación ante desastres o DRP para los sistemas de información críticos de TI, propone un proceso comprendido desde el inicio del proyecto hasta la realización de las pruebas. Se considera también realizar un análisis de riesgo, estrategias de recuperación y la definición de roles y responsabilidades. La figura siguiente, presenta las fases de esta metodología, basada en las recomendaciones del NIST, DRII y el BCI, también apoyada en la experiencia de casos prácticos realizados.
INICIO DEL PROYECTO
Se realiza en esta fase un conocimiento de la organización. Se evalúa, en esta fase, la documentación existente. Se documentan los beneficios y se deben definir también las personas que tendrán alguna responsabilidad en el proyecto. Otras actividades, de esta fase, se presentan a continuación:
Revisión de los procesos críticos a considerar en el DRP.
Entendimiento de TI
Valoración de los riesgos
Evaluación del nivel en el que se encuentra la organización y propuestas de acciones a seguir para mejorar los niveles de respuesta ante eventos que afecten la entrega de servicios.
IMPACTO SOBRE EL NEGOCIO (BIA)
El análisis del impacto sobre el negocio (BIA) es uno de los aspectos más importantes a considerar en el desarrollo de un plan de recuperación ante desastres o DRP. Se trata pues, de identificar los diversos eventos que pudieran afectar la continuidad de sistemas críticos de la información.
A continuación la descripción de estas actividades:
Identificar sitios físicos: se valida la lista de instalaciones físicas o entidades en donde opera los servicio de TI de la empresa.
Identificar sistemas de información: se obtiene la lista de los sistemas de información que se poseen en cada instalación y se determina cuáles de ellos están relacionados de manera directa o indirecta con el servicio de TI.
Evaluar la criticidad de los sistemas de información: se califica la criticidad de cada uno de los procesos relacionados con la Empresa, haciendo uso de la tabla de criticidad previamente definidas.
EVALUACIÓN DE RIESGO Y GESTIÓN DEL RIESGO
La gestión de riesgo es el punto central de la definición de una estrategia de seguridad perfectamente alineada con la visión de las empresas, dentro de su entorno de operación. Esta metodología es el resultado de la combinación de diferentes propuestas existentes en la industria, y utiliza métodos tanto cualitativos, como cuantitativos, los primeros permiten agilidad en el proceso y facilidad en la asignación de valores de impacto o riesgo, y los segundos nos permiten la precisión y exactitud, necesarias a la hora de tomar decisiones de tipo financiero, por ejemplo, en el caso de la selección de los controles adecuados, para mitigar un posible evento negativo a la operación y continuidad de los procesos. Para esta actividad las bases han sido tomadas de AU NZ 4360, COBIT 4.1, ITIL V3, ISO 27005, ISO 13335, ISO 27001, ISO 27002 y COSO.
ESTRATEGIAS DE RECUPERACION Y CONTINUIDAD DEL NEGOCIO
Las estrategias de recuperación están basadas en los resultados obtenidos luego de la realización del BIA (Business Impact Análisis), en donde también se consideran los valor de los tiempos máximos permitidos de no disponibilidad (MTD). Realizando también un análisis de la toda la información obtenida de las entrevistas, entendimiento de los procesos de negocio, BIA, MTD, se procede a organizar esta información en una tabla ordenada de prioridades de recuperación de las diferentes sistemas considerados como críticos. Los elementos a considerar son:
Redes Locales
Sistemas telefónicos
Redes WAN
Redes MAN
Internet
Personas
Infraestructura física
Aplicaciones
Hardware
Bases de datos
Sistemas operativos
Firewalls
IDS-IPS
Switches
Routers
ROLES Y RESPONSABILIDADES
Para cada una de las estrategias de mitigación y reducción establecidas. Deben identificarse los métodos, plazos, personas, recursos y tareas necesarias para implementarlas. Igualmente, deben establecerse las estructuras organizacionales, los perfiles de los cargos y los procesos, que darán sostenibilidad a la continuidad del servicio de TI (ver figura). La definición de roles y responsabilidades es uno de los aspectos más importantes del Plan de Recuperación ante desastres, porque aquí se determinan cada una de las actividades de los responsables de ejecutar el Plan, y estas actividades corresponden a las que hay que ejecutar antes, durante y después del desastre.
PRUEBAS DEL PLAN
La efectividad del DRP en situaciones de emergencia se puede valorar si existe un plan de prueba que se lleve a cabo en condiciones reales. La fase de prueba debe contener las actividades más importantes que requieran comprobación y certeza en su funcionamiento futuro. Se debe probar dentro de un ambiente que simule las condiciones que serían aplicables en una emergencia verdadera. Es también importante que las pruebas se lleven a cabo por las personas que serían responsables de esas actividades en una crisis. Estas pruebas comprenden:
Desarrollo de los objetivos y alcance de la prueba
Configuración del ambiente de prueba
Preparación de los datos de la prueba
Identificación de quién dirigirá la prueba
Identificación de quién controla y supervisa la prueba
Preparación de cuestionarios de evaluación
Preparación de presupuesto para la fase de prueba
Entrenamiento a los grupos de prueba de las unidades de negocio
EJEMPLO DE UN DRP
PLAN DE RECUPERACIÓN ANTE DESASTRES DE UNA OFICINA DE ATENCIÓN SAT
CONSIDERACIONES:
Posibles escenarios de fallas
Catástrofes naturales
Variaciones o perdida de energía eléctrica
Fallas de seguridad (jaqueo, robo de información, virus)
Uso masivo de los datos (saturación del sistema).
Errores del personal de operación
Errores de programación (sobre todo al modificar alguna aplicación, incompatibilidades)
Fallas de disco duro.
Datos críticos
Bases de datos
Passwords
Cuentas
Transacciones
Sistemas de información ejecutiva Esta información tiene su fuente en los sistemas institucionales ya que es una consolidación.
Los datos que residen en los discos duros de los usuarios En los discos duros de los escritorios hay mucha información producto de los análisis, investigaciones, proyectos, presentaciones, entrenamiento, etc. Por lo que se debe analizar su importancia y asegurar el respaldo periódico.
Programas Desarrollados internamente, porque son propiedad intelectual, están sujetos a derechos de autor. Este software debe de respaldarse, tanto los programas fuente como los objeto.
Paquetes adquiridos, como SQL, Windows, administración de proyectos, etc.
Documentación Se debe analizar la forma de recuperar la información en papel y en caso de requerirse un respaldo se puede utilizar la opción de imagen.
Periodicidad de respaldo Respaldo cada 1 hora aproximadamente. Usando respaldos normales, incremental y diarios.
Lugar de almacenamiento de respaldos
El respaldo se encuentra en una bóveda externa que podría ser un oficina externa, en un disco virtual en la red obviamente con firewall para que la información no sea robada o dentro del mismo servidor en un disco rígido.
Es de vital importancia contar con un respaldo en bóveda externa, ya que será el último recurso en caso de un desastre.
Personas que pueden hacer respaldos y restablecer
Normalmente esta actividad debe ser responsabilidad del mismo usuario de una computadora, sin embargo, dependiendo de las políticas de seguridad, algunas empresas activan la facilidad para que el operador de la red respalde su información cuando la computadora esté encendida. Principalmente personas especializadas en TI o que estén previamente capacitadas que sepan que hacer y que sepan cómo realizar los respaldos sin interrumpir a los trabajadores cuando estén cumpliendo con sus tareas y que determinen o limiten en qué hora es adecuado hacerlo, antes de que ocurra un desastre y no se pueda recuperar información. En este caso particular se cuenta con un auxiliar para ayudar en esta actividad.
****Guía de pasos para una recuperación de desastre
Respaldo total del disco y sistema operativo (mensual)
1 Depende de la volatilidad de la información.
1.2 Depende de las modificaciones (nuevas versiones, parches, rotación de cuentas de acceso, etc.)
2. Respaldo total de la información (semanal)
2.1 Los fines de semana se obtiene un respaldo de información.
2.2 En algunos casos se podría también respaldar los directorios de usuarios y privilegios de acceso.
3. Respaldo diario de bases de datos
El respaldo diario incremental es el más recomendado, si la tecnología lo permite.
4. Enviar una copia de los respaldos a bóveda externa (semanal)
Es de vital importancia contar con un respaldo en bóveda externa, ya que será el último recurso en caso de un desastre en el centro de cómputo.
Asegurarse que los respaldos sean recuperables, mediante una prueba de DD.
Asegurar la compatibilidad de los dispositivos, ya sean memorias, disco rígido, discos externos o discos duros. Es lamentable contar con respaldos pero no disponer del equipo para recuperarlos.
Otra situación frecuente es cuando el respaldo no se completó, por ejemplo cuando en DD sólo se graba la etiqueta del archivo general pero sin los datos completos. Por ello debemos asegurarnos que los datos se fueron almacenados en su totalidad.
Procedimientos de respaldo.
Se debe contar con los procedimientos de respaldo y recuperación por escrito.
Desarrollar un programa de respaldos que deberá seguirse en forma completa y ayudarse con un "checklist" para que el operador lo siga diariamente, asegurándose de ejecutar todas las acciones que se requieren para garantizar que funcione el respaldo.
Para los respaldos que sean programados en forma automática, se debe tener un proceso de aseguramiento para verificar que los respaldos automáticos sean ejecutados correctamente.
La identificación de las memorias, discos duros y otros dispositivos debe ser clara y sin fallas, no deberán confundirse los dispositivos de almacenamiento entre varios respaldos, ni utilizarlos de forma equivocada.
Procedimiento de respaldo de servidor
1. Verificar que el dispositivo sea el correcto (más actualizada la información y con los archivos que se necesitan).
2. Montar el dispositivo en la unidad.
3. Verificar la carga del dispositivo.
4. Dar comando para el respaldo.
5. Verificar que el log no haya marcado errores.
6. En caso de errores reportar al responsable.
7. Entregar el dispositivo a custodia de bóveda.
8. Revisión del dispositivo (aleatoriamente).
9. Envío a bóveda externa.
ERRORES AL ELABORAR DRP
Desarrollar y ejecutar un buen plan de recuperación ante desastre es el primer paso, sin embargo el esfuerzo no termina ahí. Un plan requiere modificaciones o correcciones tales como omisiones y errores detectados durante la etapa de desarrollo y pruebas. A continuación una lista de los principales errores que se cometen al desarrollar el plan.
Confiar ciegamente en el plan. Muchas organizaciones creen que el plan es suficiente, sin embargo este será útil en la medida en que se le de mantenimiento y se compruebe su efectividad.
Alcance limitado. Un plan incompleto no abarcará todas las necesidades de recuperación que tiene la organización. El plan requiere cubrir procesos de negocio, recuperación de sistemas, funciones "back-office" y reemplazo de personal clave si es necesario.
Débil priorización. Hay una necesidad de priorizar las funciones claves de la organización. Sin ésta tarea, se gastará mucho tiempo y dinero en la recuperación de funciones que no son cruciales para la sobrevivencia del negocio.
Planes no actualizados. El plan debe ser actualizado, especialmente cuando se realizan cambios en los procesos productivos.
Ausencia de liderazgo. Se requiere en estos proyectos de alguien con poder de liderazgo, influencia, sentido de prioridad y de organización.
Problemas de comunicación. Es necesaria una comunicación clara y precisa con los empleados, proveedores, socios y clientes.
Perdida de controles de seguridad. Durante el proceso de recuperación los controles de seguridad podrían dejarse en un segundo plano resultando en una exposición mayor al riesgo.
Pérdida de apoyo del negocio. La continuidad del negocio y la recuperación por desastre no es solo un asunto del área de tecnología. Se requiere involucrar a todas las áreas del negocio en las etapas de análisis de riesgo e impacto.
CONCLUSIÓN
Con la respectiva finalización del trabajo de investigación sobre el tema Plan de
Recuperación de Desastres (DRP) se puede concluir que todas las organizaciones están totalmente frágiles a sufrir cualquier tipo de desastre o caos dentro de sus operaciones, es por ello que es sumamente importante que se cuente con un plan debidamente estructurado y organizado para llevarlo a cabo dentro o después de ese tipo de actividades que puedan afectar la estabilidad de los objetivos de la empresa.
Para llevar a cabo un plan de recuperación de desastres es necesario que se tomen en cuenta la asignación de roles y responsabilidades, también cabe mencionas las diferentes certificaciones de las cuales se pueden tomar puntos muy importante a la hora de desarrollar dicho plan.
La mayoría de las empresas no toman la iniciativa de realizar un plan de recuperación hasta después que les han ocurrido los hechos que causaron daños y pérdidas. Es por eso que hoy en día es sumamente importante implementar este tipo de planes para a la hora de que surgan inconvenientes, la organización puede recuperar sus labores y actividades en el menor tiempo posible, permitiendo así que las pérdidas por dichos caos no afecten en gran totalidad la estabilidad de la organización.
Existen empresas que brindan la implementación de planes de recuperación de desastres a otras organizaciones, asegurándoles bajo cierto porcentaje de confiabilidad que sus servicios serán reanudados en el menor tiempo posible y que sus actividades no se verán afectadas en la mayoría de áreas posibles.
BIBLIOGRAFIA
Cano, F. (04 de abril de 2013). seinhe. Obtenido de www.seinhe.com
informationsecuritygroup3udec. (2011). Obtenido de www.nformationsecuritygroup3udec.com
Miranda, C. (03 de marzo de 2013). blog.celingest. Obtenido de www.blog.celingest.com
SISTESEG. (s.f.). Risk Management for your business. Colombia.
SyBase. (2010). CheckList for Disaster Recovery.
Inicio de proyecto
Analisis de impacto sobre el servicio de TI
Evaluacion de Riesgos
Definicion de roles y responsabilidades
Pruebas del Plan
Fin del DRP