Arquivo para a categoria 'High End'

Infortrend EonStor – Password Recovery

A empresa onde eu trabalho tem alguns modelos de Storage da Infortrend. Não é uma marca muito popular, talvez você não tenha ouvido falar ainda, mas eu já vi várias outras empresas que utilizam equipamentos deste fabricante.

Enfim, semana passada caiu no meu colo um problema pra resolver. Uma storage que está alocada

Storage

Storage Infortrend EonStor A12F-G1A2

em um cliente (não foi eu quem instalou/configurou), começou a apitar, e isso quer dizer que tem alguma coisa de errado, como fonte queimada, ventilação danificada e no pior caso algum disco foi pro pau danificando um array. Ao chegar no local, constatei visualmente que não era problema com as fontes e nem com a ventilação. Fui tentar logar no equipamento, que estava protegido com senha. Uma senha que eu não sabia qual era. Tentei falar com todas as pessoas da empresa que poderiam ter tido algum contato no setup da Storage, ninguém sabia a senha. Tentei todas as combinações possíveis e imagináveis de todas as senhas que já utilizamos na empresa, desde quando eu nela em 2005. Nada!

Já pensando no pior, comecei a pesquisar se existia algum procedimento de password recovery. Não achei nada muito confiável. Falei com o pessoal que vendeu o equipamento pra nós, e eles me passaram um caminho. Só por desencargo de conciência abri um chamado direto com a Infortrend, que me orientou como proceder para fazer um restore default no sistema, garantindo que nenhum dado seria perdido, nem configurações de array, somente de mapeamento. De qualquer forma teria que fazer backup de tudo, muitos dados, mais ou menos uns 2Tb, mas o pior seria parar a solução (que ainda estava em produção mesmo um problema desconhecido), fazer o processo, torcer pra dar 100% certo, etc…

Voltei ao cliente e resolvi tentar as senhas novamente… Nunca é de mais antes de arriscar um procediemento desses… tentei várias combinações, maiúsculas, minúsculas e nada… Até que me lembrei que não tinha tentado ainda o trivial… Pois é, quase eu dou esse vacilo… Tentei: “123456″. Tcharammmmm! Deu certo… que alívio… entrei na configuração da controladora, vi que tinha um  raid5 em degraded , iniciei o rebuild, e tudo voltou ao normal! Ufa, uma bomba a menos.

O que valeu dessa história foram dois documents oficiais da Infortrend sobre como fazer o restore default sem perder dado nenhum. Doc1 e Doc2.  E claro, mesmo quando o problema parace sério nunca é de mais manter a calma, respirar, raciocinar… falou!

Controladora SATA Adaptec 1420SA e Windows 2003 64b

Essa semana, em um órgão público distrital, tive que resolver um problema. O servidor deles não completava o boot. Acusava problema de disco. A máquina tem 4 discos SATA2 de 750Gb, controlados por uma Adaptec 1420SA. A máquina era o nó backup de um cluster de Exchange, que serve e-mail para algumas milhares de contas. Menos mal, o
Controladora SATA 1420SA

Controladora Adaptec 1420SA

serviço não estava parado, porém estava sem redundância, o que é crítico para uma infra daquele porte.

Nunca configurei um servidor Windows 2003 64b Enterprise que roda e-mail em Cluster, mas o colaborador do órgão que me acompanhou disse que é uma tarefa bem complicada. Os discos estavam configurados da seguinte maneira: 1 raid1 que tinha o SO e outro raid1 que tinha alguns dados que não eram importantes. A situação não era das melhores, o raid que tinha os dados estava em status “failed”, ou seja, já era, porém sem prejuízos grandes, pois não haviam arquivos importantes alí. Já o raid que interessava, o que tinha a instalação do sistema operacional, estava como “degraded”, sendo que um disco estava ruim, e o outro bom.

Substituí o disco ruim, e fiz rebuild, procedimento que recupera o

Tela de Boot do Windows 2003

Tela de Boot do Windows 2003

raid, e a redundância dos discos. No dia seguinte voltei para ver o resultado (o processo é demorado). O rebuild foi concluído com sucesso. Reiniciamos o servidor e para o nosso alívio o windows subiu, perfeitamente. Então voltamos à controladora e deletamos o outro raid, o que tinha dados sem importância, e então reiniciamos o servidor novamente, certos de que o problema havia sido resolvido. Uma mensagem desagradável apareceu: “No SO Found”. Senti um calafrio, e o colega que aguardava a recuperação da máquina com esperança fez uma cara do tipo: “vou perder a noite ou o final de semana reinstalando tudo”. A primeira coisa que veio a minha cabeça foi se eu tinha apagado o raid errado. Mas não podia ser isso, verifiquei e estava ok. Ufa… O raid com o SO estava alí. Então percebi nas configurações da Adaptec que na verdade ele não estava mais “bootable”, ou bootável. Fiz o ajuste, reiniciamos e começamos a torcer! E pra alegria de todos, a tela de boot do windows apareceu, e começamos comemorar. Aqui faço uma observação importante: não cante vitória antes da hora.

Uma tela azul apareceu, muito rápido, a máquina reiniciou, e ficou nesse ciclo, começava a carregar o 2003 e

Um exemplo de Tela Azul do Windows

Um exemplo de Tela Azul do Windows

em seguida exibia a tela azul sem tempo nem pra ler, e então reiniciava… Aí o colaborador do órgão retornou àquela expressão facial de terror, dessa vez  com um aspecto mais conformado. Eu não acreditava, pois minutos atrás tinha visto o windows subir certinho, após o rebuild. Não me dei por vencido, tinha que ter alguma coisa errada. Tentei de tudo. Verifiquei as configurações de boot, configurações na controladora, tentei subir o windows com a última configuração válida, também em modo de segurança, e nada. Então eu disse algo que parecia sem sentido pra pessoa que me acompanhava: “por desencargo de conciência, vamos recriar o raid de dados que apagamos, pois é a única coisa que mudou na máquina… Vai que o windows “achou ruim” que um device que já estava vazio e sem funcionar tenha sumido!”. Então voltei na controladora, recriei o raid1 com os dois discos que não estavam em uso, e reboot. E a tela do windows apareceu e nós já esperávamos pela tela azul… Mas a tela do windows não sumia, a tela azul não vinha, e pra alegria geral o windows subiu… A cara do funcionário então passou a ser um misto de espanto, desconfiança e alegria. Ele testou e tudo estava perfeito. Os raids estavam em “optimal”. Tudo ok, mais um servidor dado como perdido recuperado!

Conclusão: nem tudo que parece perdido está de fato perdido. E se estiver perdido, paciência. O importante é manter a calma, pensar e tentar tudo, até o que não parece fazer muito sentido.


Twitter


Seguir

Obtenha todo post novo entregue na sua caixa de entrada.