Questes Frequentemente Perguntadas e Dicas


1. Hey! Isto no se parece com um FAQ! O que ele me oferece?
2. O que  um cluster?
3. O que  um script de recurso?
4. Como monitorar vrios recursos?
5. Toda vez que minha mquina libera um alias IP, ele perde a interface toda 
(isto , eth0)! Como eu posso fix-lo?
6. Eu quero muitos endereos IP como recursos (mais de 8). Qual  a melhor 
maneira?
7. A documentao indica que uma linha serial  obrigatria, mas quando eu 
comento a linha no arquivo de configurao e uso somente duas conexes 
ethernet percebi que trabalham bem.
8. Qual  a diferena entre normal e nice failback?
9. Como usar o heartbeat com o firewall ipchains?
10. Como sintonizar o heartbeat em sistemas com carga pesada?
11. Quando eu tento iniciar o heartbeat recebo a mensagem:
"Starting High-Availability services: Heartbeat failure [rc=1]. Failed.
e no h nada em qualquer arquivo de log. O que est errado?
12. Como rodar multplos clusters no mesmo segmento de rede?
13. Como pegar a ltima verso do CVS do heartbeat?
14. Heartbeat em outros SOs.
15. Se nada me ajuda, o que eu devo fazer?

------------------------------------------------------------------------------

1.
---
Acabe suas clicas! Precisamos de um documento "pega-tudo" para suprir 
informaes teis de um modo que foi facilmente referenciado e que 
cresceriam sem um monte de trabalho. Ele termina em um FAQ mais que qualquer 
outra coisa.

2.
---
HA (cluster de Alta Disponibilidade) - Isto  um cluster que permite um host 
(ou hosts) tornarem-se Altamente Disponveis, que significa que se um nodo 
falha (ou um servio que o nodo fornece falha) outro nodo assume o servio 
ou nodo e passa a responder pela mquina que falhou. http://www.linu-ha.org/
Cluster de processamento - Isto  o que um cluster Beowulf . Permite 
processamento distribudo atravs de componentes de prateleira. Neste caso  
usualmente barato mquinas IA32. http://www.beowulf.org/
Cluster de balanceamento de carga - Isto  o projeto Linux Virtual Server 
faz. Neste cenrio voc tem uma mquina com balano de cargo em requisies 
para um certo servidor (apache por exemplo) atravs de uma fazenda de 
servidores. http://www.linuxvirtualserver.org/
Todos esses sites possuem howtos, etc. Para uma viso geral sobre clustering 
sob Linux, consulte o Clustering HOWTO.

3.
---
Script de recurso so basicamente (extendido) scripts de inicializao 
System V. Eles possuem suporte as operaes stop (parar), start (iniciar) e 
status (estado). No futuro adicionaremos tambm suporte para um operao 
"monitor" para monitoramento de servios assim que voc os requisitar. O 
script IPaddr implementa esta nova operao monitor agora (mas o heartbeat 
no usa esta funo dele). Para mais informaes veja Resource HOWTO.

4.
---
O Heartbeat por si s no foi designado para monitorar vrios recursos. Se 
voc presisa monitorar alguns recursos (por exemplo, disponibilidade de um 
servidor WWW) voc precisa de algum terceiro grupo de software. Uma boa 
soluo  o mon.
1. Pegue o mon
   http://kernel.org/software/mon

2. Pegue todos os mdulos requeridos listados. Voc pode localiz-los em um 
mirror mais prximo ou no arquivo CPAN )www.cpan.org). Eu no estou muito 
familiarizado com Perl, ento eu baixei-o do arquivo CPAN em pacotes .tar.gz 
e instalei-os do modo usual (perl Makefile.pl && make && make test && make 
install).

3. Mon  um software para monitoramento diferente dos recursos da rede. Ele 
pode pingar computadores, conectar-se por vrias portas, monitorar WWW, 
MySQL, etc. No caso de uma disfuno de alguns recursos ele dispara scripts.

4. Descompacte o mon em algum diretrio. O melhor ponto de partida  o 
arquivo README. A documentao completa est em <dir>/doc, onde <dir> est 
localizado onde voc descompactou o mon.

5. Para um rpido incio faa os seguintes passos:
Copie todos os subdiretrios localizados em <dir> para /usr/lib/mon
Crie o diretrio /etc/mon
Copie auth.cf de <dir>/etc para /etc/mon

Agora, o mon est preparado para trabalhar. Voc precisa criar seu prprio 
arquivo mon.cf, onde voc informar os recursos que o mon deve verificar e 
quais aes o mon ir iniciar em caso de disfuno e quando recursos esto 
disponveis novamente. Todos os scripts de monitoramento esto em 
/usr/lib/mon/mon.d/. No incio (cabealho) de cada script voc pode 
localizar uma explicao de como us-lo.
Todos os scripts de alerta esto localizados em /usr/lib/mon/alert.d/. Esses 
scripts so disparados quando algo estiver errado. No caso voc est usando 
ipvs em sua homepage (www.linuxvirtualserver) voc pode localizar scripts 
para adicionar e remover servidores da lista ipvs.

5.
---
Isto no  um problema com o heartbeat, mas ao contrrio  causado por 
vrias verses de ferramentas de rede. Atualize para as verses mais 
recentes das ferramentas de rede e elas iro longe. Voc pode test-las com 
ifconfig manualmente.

6.
---
Ao invs de falhar muitos endereos IP, somente falha um endereo do 
roteador. No seu roteador, faa a "route add -net x.x.x.0/24 gw x.x.x.2", 
onde x.x.x.2  o endereo IP controlado pelo heartbeat. Ento, faa todos os 
endereos com x.x.x.0/24 que voc quiser para falhar um alias permanente de 
lo0 em AMBOS os nodos do cluster. Isto  feito via "ifconfig lo:2 x.x.x.3 
netmask 255.255.255.255 -arp" etc...

7.
---
Ele trabalhar, entretanto se alguma coisa fizer sua ethernet / pilha de IP 
falhar, voc perder ambas as conexes. Voc definitivamente deve rodar 
cabos diferentes, dependendo de quo importante seus dados so...

8.
---
Modo normal failback:
Neste modo, uma das duas mquinas  designada como fornecedor preferido de 
um dado grupo de recursos. Se a mquina est no ar, ento ela sempre ir ser 
fornecedora de todo o grupo de recursos para o qual ele  designado. Falhas 
ocorrem quando esta mquina sai de servio, e quando ela retorna (failback). 
Neste modo  requerido se voc deseja uma configurao ativa-ativa.
Modo nice failback:
Neste modo, no h afinidade natural entre um grupo de recursos e um nodo 
particular no cluster (arquivo haresources no se opondo). Ao invs disso, 
h uma afinidade entre um grupo de recursos e qualquer mquina que est 
atualmente rodando. Falhas ocorrem *somente* quando uma mquina que est 
fornecendo um servio sai de funcionamento. No h o conceito de failback 
neste modo. Este modo minimiza interrupes de servio, mas no pode rodar 
uma configurao ativa-ativa.

9.
---
Para fazer o heartbeat trabalhar com ipchains, voc deve aceitar trfego de 
entrada e sada na porta UDP 694. Adicione algo como
/sbin/ipchains -A output -i ethN -p udp -s <IP_origem>  -d <IP_destino> -j 
ACCEPT
/sbin/ipchains -A input -i ethN -p udp -s <IP_origem> -d <IP_destino>  -j 
ACCEPT

10.
---
Existe a probabilidade que o padro no esteja de acordo para a maioria dos 
sistemas linux sob carga pesada (desculpe!), aqui est a sugesto:
Configure deadtime para 60 segundos ou mais
Configura warntime para qualquer coisa que voc *desejar* que seu deadtime 
seja.
Rode seu sistema sob carga pesada por algumas semanas.
Veja em seus logs o tempo que seu sistema ficou sem ouvir um heartbeat.
Configure seu deadtime para 1,5 - 2 vezes o que voc encontrou. Configure o 
warntime para o valor que voc encontrou nos logs.
Continue a monitorar os logs para avisos sobre tempos de heartbeat longos.

11.
---
Provavelmente  um problema de permisso no arquivo authkeys. Ele precisa 
estar em modo de somente leitura (400, 600 ou 700). Dependendo de onde e 
quando o heartbeat descobrir o problema, a mensagem estar localizada em 
diferentes locais.
Mas, ele tende a estar em
a) stdout/stderr
b) qualquer lugar que voc especificou em sua configurao
c) /var/log/messages

12.
---
Utilizar multicast e pegar cada um de seus prprio grupo multicast. Se voc 
precisa/quer usar broadcast, ento rode cada cluster em nmeros de portas 
diferentes.

13.
---
H um depsito CVS para Linux-HA. Voc pode encontr-lo em cvs.linux-ha.org. 
Acesse somente leitura via usurio guest, senha guest, nome de mdulo 
linux-ha. Mais detalhes esto localizados no email do anunciante. Est 
disponvel tambm atravs da web utilizando viewcvs em 
http://cvs.linux-ha.org/viewcvs.cgi/linux-ha

14.
---
Heartbeat est sendo portado atualmente para usar automake.

15.
---
Por favor esteja certo que voc leu toda a documentao e procurou nos 
arquivos das listas de discusses. Se voc continuar no encontrando uma 
soluo voc pode postar para a lista de discusso. Por favor inclua o 
seguinte:
- Qual SO voc est utilizando.
- Qual verso (distro/kernel).
- Como voc instalou o heartbeat (tar.gz, rpm, src.rpm ou instalao 
manual).
- Inclua os seus logs que descrevem o erro. Envie-os como anexos. Por favor 
no envie logs "limpos". Os logs reais tem mais informao neles do que 
verses limpas. Sempre inclua pelo menos  uma pequena informao irrelevante 
ante e depois dos eventos em questo, ento saberemos que voc no se 
esqueceu de nada. No edit os logs a menos que voc realmente tenha algo 
super-secreto ou razo de alta-segurana para fazer isso.

------------------------------------------------------------------------------

Rev 0.0.5
(c) 2000 Rudy Pawul rpawul@iso-ne.com
(c) 2001 Dusan Djordjevic dj.dule@linux.org.yu

Traduo: Mauro Alexandre Nogueira (Mandcap) <mauronogueira@pop.com.br>

