dbo:abstract
|
- Un clúster de alta disponibilidad es un conjunto de dos o más Maquinas virtuales máquinas que se caracterizan por mantener una serie de servicios compartidos y por estar constantemente monitorizándose entre sí. No hay que confundir un clúster de alta disponibilidad con un clúster de alto rendimiento. El segundo es una configuración de equipos diseñado para proporcionar capacidades de cálculo mucho mayores que la que proporcionan los equipos individuales (véanse por ejemplo los sistemas de tipo Cluster Beowulf), mientras que el primer tipo de clúster está diseñado para garantizar el funcionamiento ininterrumpido de ciertas aplicaciones. Este tipo de clusters son usados usualmente para balanceadores de carga, servicios de respaldo y conmutación por error. Para configurarlos de manera correcta, todos los servidores deben de tener acceso a la misma memoria compartida, para que en caso de que alguno de estos falle, una maquina virtual se pueda lanzar desde otro de los servidores y realizar sus tareas sin tiempo de inactividad. Esta capacidad de los clusters de restablecer en pocos segundos un servicio, manteniendo la integridad de los datos, permite que en muchos casos los usuarios no tengan por que notar que se ha producido un problema. Cuando una avería de este tipo, en un sistema sin cluster, podría dejarles sin servicio durante horas. La utilización de clusters no solo es beneficiosa para caídas de servicio no programadas, si no que también es útil en paradas de sistema programadas como puede ser un mantenimiento hardware o una actualización software. (es)
- High-availability clusters (also known as HA clusters, fail-over clusters) are groups of computers that support server applications that can be reliably utilized with a minimum amount of down-time. They operate by using high availability software to harness redundant computers in groups or clusters that provide continued service when system components fail. Without clustering, if a server running a particular application crashes, the application will be unavailable until the crashed server is fixed. HA clustering remedies this situation by detecting hardware/software faults, and immediately restarting the application on another system without requiring administrative intervention, a process known as failover. As part of this process, clustering software may configure the node before starting the application on it. For example, appropriate file systems may need to be imported and mounted, network hardware may have to be configured, and some supporting applications may need to be running as well. HA clusters are often used for critical databases, file sharing on a network, business applications, and customer services such as electronic commerce websites.HA cluster implementations attempt to build redundancy into a cluster to eliminate single points of failure, including multiple network connections and data storage which is redundantly connected via storage area networks. HA clusters usually use a heartbeat private network connection which is used to monitor the health and status of each node in the cluster. One subtle but serious condition all clustering software must be able to handle is split-brain, which occurs when all of the private links go down simultaneously, but the cluster nodes are still running. If that happens, each node in the cluster may mistakenly decide that every other node has gone down and attempt to start services that other nodes are still running. Having duplicate instances of services may cause data corruption on the shared storage. HA clusters often also use quorum witness storage (local or cloud) to avoid this scenario. A witness device cannot be shared between two halves of a split cluster, so in the event that all cluster members cannot communicate with each other (e.g., failed heartbeat), if a member cannot access the witness, it cannot become active. (en)
- HAクラスタ(HAクラスター、密結合型クラスター、密結合クラスター)とは、システムに何らかの障害が発生した場合に備えて、障害発生後でもシステム全体の機能を維持し続けられるように予備の装置を平常時からバックアップとして配置し運用しておく冗長ネットワークノードで構成される複数のコンピュータアーキテクチャーで、プライマリーサービスに障害が発生したときにセカンダリーまたはバックアップサービスを提供する。クラスターに参加するノード間で各種資源と情報を共有し、1台のサーバのように動作するクラスターのこと。密結合クラスターでは、多くの場合、幾つかのサービスを提供する計算資源/処理環境を、1台のコンピュータに模して提供するため、クラスターに参加する個々のノードの障害によるサービスの中断を防ぐことが可能となる。 その代表的な例として、高可用クラスターがある。高可用クラスターを構成するノードは、多くの場合、共有リソースとしてのストレージや共有メモリ領域を持ち、実際にサービスを提供する稼動系ノードと、それをバックアップするための待機系ノードが存在する。現在の主流の形態としては、稼動ノードがN台存在し、それをバックアップする待機ノードが1台という形態(N+1構成と呼ぶ)を持つ構成が取られる事が多い。 高可用クラスターの弱点として、本来、サービス提供を行なうノードがM個存在すべき処、M+1以上のサービスノードが稼動してしまい、仮想的に割り当てられるIPアドレスの競合や、想定外の資源の奪い合いが発生し、クラスター全体や、そのクラスターを利用するシステム全体が停止してしまう事象が発生しうる点にある。この状態をスプリットブレインシンドローム(SBS)と呼び、高可用クラスターにおける忌避すべき状態である。多くの高可用クラスターパッケージでは、このSBSを避けるため、クォーラムディスク(ロックディスク)やSCSIロック(SCSIリサーブ/フェンシングなどの呼称が存在する)によるノードのサバイバルスキーマ/ロジックを持ち、サービスの継続提供を意識した制御を行っている。 商用UNIX/Linux上の高可用クラスターによるDBクラスター等では、ノード間での情報共有にシェアード(共有)ディスクを利用し、DBファイルの引継ぎなどの情報の継続性を図る。さらにこのシェアードディスクへのアクセスパスを複数持ち(ストレージマルチパス)、あるパスの障害時には健常なパスへ自動で切り替えるなど、サービスのサバイバリティ向上を目指した施策が多く取り入れられている。 また、ノード間の監視には監視パケット専用のLAN(ハートビートLAN)を複数もち、ハートビートと呼ばれる独自監視用パケットを飛ばし合う事で互いの動作を監視しあう方式を取るものが主流である。 商用UNIX/Linuxの高可用クラスターパッケージの代表例としてAIXのHACMP、HP-UXのMC/ServiceGuard、SolarisのSunClusterが、複数の環境に対応するVxClusterServerが存在する。またLinuxでは、(サイオステクノロジー)、CLUSTERPRO(NEC)などがある。Windows向けとしては「Windows Server Failover Cluster」がある。オープンソースソフトウェアとしてはLinuxで動くPacemaker/Heartbeat/Corosync などが存在する。 (ja)
- I cluster High Availability, o Cluster HA, sono una tipologia di cluster disegnata per garantire continuità dei servizi informatici erogati. L'impiego di componenti ridondanti, algoritmi e protocolli di monitoraggio dell'attività dei singoli nodi e l'analisi del flusso delle informazioni consente di offrire elevatissime garanzie di funzionamento. (it)
- Um sistema de alta disponibilidade (HA:High-Availability) é um sistema informático resistente a falhas de hardware, software e energia, cujo objetivo é manter os serviços disponibilizados o máximo de tempo possível. Cada vez mais é necessário garantir a disponibilidade de um serviço, mas sendo que muitos componentes dos sistemas de informação actuais contêm partes mecânicas, a fiabilidade destes é relativamente insuficiente se o serviço for crítico. Para garantir a ausência de é necessário, muitas vezes, dispôr de hardware redundante que entre em funcionamento automaticamente quando da falha de um dos componentes em utilização. Quanto mais redundância existir, menores serão os SPOF (Single Point Of Failure), e menor será a probabilidade de interrupções no serviço. Até há poucos anos tais sistemas eram muito dispendiosos, e tem-se vindo a intensificar uma procura em soluções alternativas. Surgem então os sistemas construídos com hardware acessível (clusters), altamente escaláveis e de custo mínimo. Cluster é um conceito que está diretamente relacionado aos sistemas de alta disponibilidade e que permite agregar vários computadores, ou servidores, como se fossem uma única máquina de grande porte. A Figura 1 ilustra a configuração típica de um sistema de alta disponibilidade dual-node: Como se pode observar, não existe um único ponto nesta arquitetura que, ao falhar, implique a indisponibilidade de outro ponto qualquer (SPOF). O facto de ambos servidores se encontram em funcionamento e ligados à rede não implica, porém, que se encontrem a desempenhar as mesmas tarefas. Esse é uma decisão por parte do administrador e que tem o nome de balanceamento de carga. A Tabela 1 ilustra um dos termos de comparação geralmente utilizado na avaliação de soluções HA: níveis de disponibilidade segundo tempos de indisponibilidade. Excluídos desta tabela, os tempos de downtime estimados (geralmente para manutenção ou reconfiguração dos sistemas) são alheios às soluções e muito variáveis. Geralmente, quanto maior a disponibilidade, maior a redundância e custo das soluções: tudo depende do tipo de serviço que se pretende disponibilizar. Por exemplo, um operador de telecomunicações quererá certamente o mais elevado a fim de poder garantir um elevado nível de disponibilidade, sob pena de perder os seus clientes caso o sistema sofra falhas constantemente. No entanto, uma empresa com horário de trabalho normal poderá considerar que 90% de disponibilidade serão suficientes. É de salientar que o nível de disponibilidade mensal não é o mesmo que o anual. Efectivamente, para se obter um nível de disponibilidade mensal de 97%, é necessário que o nível anual seja aproximadamente de 99,75%. A tolerância a falhas consiste, basicamente, em ter hardware redundante que entra em funcionamento automaticamente após a detecção de falha do hardware principal. Independentemente da solução adoptada, existe sempre dois parâmetros que possibilitam mensurar o grau de tolerância a falhas que são o MTBF - Mean Time Between Failures - (tempo médio entre falhas) e o MTTR - Mean Time To Repair - (tempo médio de recuperação), que é o espaço de tempo (médio) que decorre entre a ocorrência da falha e a total recuperação do sistema ao seu estado operacional. A disponibilidade de um sistema pode ser calculada pela fórmula: Disponibilidade = MTBF / (MTBF + MTTR) (pt)
- Отказоустойчивый кластер (англ. High-Availability cluster, HA cluster — кластер высокой доступности) — кластер (группа серверов), спроектированный в соответствии с методиками обеспечения высокой доступности и гарантирующий минимальное время простоя за счёт аппаратной избыточности. Без кластеризации сбой сервера приводит к тому, что поддерживаемые им приложения или сетевые сервисы оказываются недоступны до восстановления его работоспособности. Отказоустойчивая кластеризация исправляет эту ситуацию, перезапуская приложения на других узлах кластера без вмешательства администратора в случае обнаружения аппаратных или программных сбоев. Процесс перезапуска известен как аварийное переключение. В рамках этого процесса программное обеспечение кластеризации может дополнительно настроить узел перед запуском приложения на нём (например, импортировать и смонтировать соответствующие файловые системы, переконфигурировать сетевое оборудование или запустить какие-либо служебные приложения). Отказоустойчивые кластеры широко используются для поддержки важных баз данных, хранения файлов в сети, бизнес-приложений и систем обслуживания клиентов, таких как сайты электронной коммерции. Реализации HA-кластеров представляют собой попытки достигнуть отказоустойчивости кластера в целом путём исключения критических точек отказа, в том числе за счёт резервирования вычислительных мощностей, сетевых подключений и хранилищ данных, объединённых в избыточную Сеть хранения данных. (ru)
- Відмовостійкий кластер, кластер високої доступності (англ. High-Availability cluster, HA cluster) — кластер, що спроектований відповідно до методик забезпечення високої доступності і гарантує мінімальний час простою за рахунок апаратної надмірності. Без кластеризації збій сервера призводить до того, що підтримувані ним додатки або мережеві сервіси виявляються недоступними. Відмовостійка кластеризація виправляє дану ситуацію, перезапускаючи додатки на інших вузлах кластера без втручання адміністратора, в разі виявлення апаратних або програмних збоїв. Процес перезапуску відомий як аварійне перемикання. В рамках цього процесу програмне забезпечення кластеризації може додатково налаштувати вузол перед запуском програми на ньому (наприклад, імпортувати і монтувати відповідні файлові системи, переналаштовуючи мережеве обладнання або запускаючи будь-які службові додатки). Відмовостійкі кластери широко використовуються для підтримки важливих баз даних, зберігання файлів в мережі, бізнес-додатків і систем масового обслуговування клієнтів. Реалізації HA-кластерів є спробами досягнення відмовостійкості кластера в цілому, шляхом виключення критичних точок відмови, в тому числі за рахунок резервування обчислювальних потужностей та здійснення підключення до мережі і сховищ даних, об'єднаних в надлишкову мережу зберігання даних. (uk)
- 高可用性集群(英語:High-availability clusters,也称为HA集群、故障转移集群)是以最短的中断时间为目标而可靠地运作的,支撑服务器应用的一组计算机。它们通过使用高可用性软件来管理集群中的冗餘计算机,当系统组件出现故障时,这些计算机可以继续提供服务。在没有集群的情况下,如果运行特定应用的服务器崩溃,那么在崩溃的服务器得到修复之前,应用将不可用。HA集群通过检测硬件/软件故障,并立即在另一个系统上重新启动应用程序来补救这种情况,而不需要进行人工干预,这个过程称为故障转移。作为这个过程的一部分,集群软件可能会在启动节点上的应用之前对节点进行配置。例如,可能需要导入和挂载适当的文件系统,可能需要配置网络硬件,还可能需要运行一些支撑应用。 HA集群通常用于关键数据库、网络上的文件共享、业务应用和客户服务(如电子商务網站)。 HA集群实现试图在集群中建立冗余以消除单点故障,包括连接多个网络,以及通过存储区域网络冗余连接一些数据存储。 HA集群通常使用心跳专用网络连接,用于监视集群中每个节点的健康状况和状态。所有集群软件必须能够处理的一个不明显但严重的情况是脑裂问题,这种情况发生在所有专用链路同时中断,但集群节点仍在运行时。如果发生这种情况,集群中的每个节点都可能会错误地判断其他节点已经停机,并尝试启动其他节点仍在运行的服务。重复服务实例可能会导致共享存储上的数据损坏。 HA集群通常也使用仲裁见证存储(本地或云)来避免这种情况。见证设备无法在裂开后的集群的两半之间共享,因此,在所有集群成员都无法相互通信(如心跳失败)的情况下,如果某个成员无法访问见证,该设备将无法激活。 (zh)
|
rdfs:comment
|
- I cluster High Availability, o Cluster HA, sono una tipologia di cluster disegnata per garantire continuità dei servizi informatici erogati. L'impiego di componenti ridondanti, algoritmi e protocolli di monitoraggio dell'attività dei singoli nodi e l'analisi del flusso delle informazioni consente di offrire elevatissime garanzie di funzionamento. (it)
- Un clúster de alta disponibilidad es un conjunto de dos o más Maquinas virtuales máquinas que se caracterizan por mantener una serie de servicios compartidos y por estar constantemente monitorizándose entre sí. (es)
- High-availability clusters (also known as HA clusters, fail-over clusters) are groups of computers that support server applications that can be reliably utilized with a minimum amount of down-time. They operate by using high availability software to harness redundant computers in groups or clusters that provide continued service when system components fail. Without clustering, if a server running a particular application crashes, the application will be unavailable until the crashed server is fixed. HA clustering remedies this situation by detecting hardware/software faults, and immediately restarting the application on another system without requiring administrative intervention, a process known as failover. As part of this process, clustering software may configure the node before starti (en)
- HAクラスタ(HAクラスター、密結合型クラスター、密結合クラスター)とは、システムに何らかの障害が発生した場合に備えて、障害発生後でもシステム全体の機能を維持し続けられるように予備の装置を平常時からバックアップとして配置し運用しておく冗長ネットワークノードで構成される複数のコンピュータアーキテクチャーで、プライマリーサービスに障害が発生したときにセカンダリーまたはバックアップサービスを提供する。クラスターに参加するノード間で各種資源と情報を共有し、1台のサーバのように動作するクラスターのこと。密結合クラスターでは、多くの場合、幾つかのサービスを提供する計算資源/処理環境を、1台のコンピュータに模して提供するため、クラスターに参加する個々のノードの障害によるサービスの中断を防ぐことが可能となる。 その代表的な例として、高可用クラスターがある。高可用クラスターを構成するノードは、多くの場合、共有リソースとしてのストレージや共有メモリ領域を持ち、実際にサービスを提供する稼動系ノードと、それをバックアップするための待機系ノードが存在する。現在の主流の形態としては、稼動ノードがN台存在し、それをバックアップする待機ノードが1台という形態(N+1構成と呼ぶ)を持つ構成が取られる事が多い。 (ja)
- Um sistema de alta disponibilidade (HA:High-Availability) é um sistema informático resistente a falhas de hardware, software e energia, cujo objetivo é manter os serviços disponibilizados o máximo de tempo possível. Como se pode observar, não existe um único ponto nesta arquitetura que, ao falhar, implique a indisponibilidade de outro ponto qualquer (SPOF). O facto de ambos servidores se encontram em funcionamento e ligados à rede não implica, porém, que se encontrem a desempenhar as mesmas tarefas. Esse é uma decisão por parte do administrador e que tem o nome de balanceamento de carga. (pt)
- Відмовостійкий кластер, кластер високої доступності (англ. High-Availability cluster, HA cluster) — кластер, що спроектований відповідно до методик забезпечення високої доступності і гарантує мінімальний час простою за рахунок апаратної надмірності. Без кластеризації збій сервера призводить до того, що підтримувані ним додатки або мережеві сервіси виявляються недоступними. Відмовостійка кластеризація виправляє дану ситуацію, перезапускаючи додатки на інших вузлах кластера без втручання адміністратора, в разі виявлення апаратних або програмних збоїв. Процес перезапуску відомий як аварійне перемикання. В рамках цього процесу програмне забезпечення кластеризації може додатково налаштувати вузол перед запуском програми на ньому (наприклад, імпортувати і монтувати відповідні файлові системи, пе (uk)
- Отказоустойчивый кластер (англ. High-Availability cluster, HA cluster — кластер высокой доступности) — кластер (группа серверов), спроектированный в соответствии с методиками обеспечения высокой доступности и гарантирующий минимальное время простоя за счёт аппаратной избыточности. Без кластеризации сбой сервера приводит к тому, что поддерживаемые им приложения или сетевые сервисы оказываются недоступны до восстановления его работоспособности. Отказоустойчивая кластеризация исправляет эту ситуацию, перезапуская приложения на других узлах кластера без вмешательства администратора в случае обнаружения аппаратных или программных сбоев. Процесс перезапуска известен как аварийное переключение. В рамках этого процесса программное обеспечение кластеризации может дополнительно настроить узел перед (ru)
- 高可用性集群(英語:High-availability clusters,也称为HA集群、故障转移集群)是以最短的中断时间为目标而可靠地运作的,支撑服务器应用的一组计算机。它们通过使用高可用性软件来管理集群中的冗餘计算机,当系统组件出现故障时,这些计算机可以继续提供服务。在没有集群的情况下,如果运行特定应用的服务器崩溃,那么在崩溃的服务器得到修复之前,应用将不可用。HA集群通过检测硬件/软件故障,并立即在另一个系统上重新启动应用程序来补救这种情况,而不需要进行人工干预,这个过程称为故障转移。作为这个过程的一部分,集群软件可能会在启动节点上的应用之前对节点进行配置。例如,可能需要导入和挂载适当的文件系统,可能需要配置网络硬件,还可能需要运行一些支撑应用。 HA集群通常用于关键数据库、网络上的文件共享、业务应用和客户服务(如电子商务網站)。 HA集群实现试图在集群中建立冗余以消除单点故障,包括连接多个网络,以及通过存储区域网络冗余连接一些数据存储。 HA集群通常使用心跳专用网络连接,用于监视集群中每个节点的健康状况和状态。所有集群软件必须能够处理的一个不明显但严重的情况是脑裂问题,这种情况发生在所有专用链路同时中断,但集群节点仍在运行时。如果发生这种情况,集群中的每个节点都可能会错误地判断其他节点已经停机,并尝试启动其他节点仍在运行的服务。重复服务实例可能会导致共享存储上的数据损坏。 (zh)
|