2013/3/12 Andreu Sànchez i Costa <span dir="ltr"><<a href="mailto:andreu.sanchez@iws.es" target="_blank">andreu.sanchez@iws.es</a>></span><br><div class="gmail_quote"><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">

  
    
  
  <div text="#000000" bgcolor="#FFFFFF">
    <div>Hello Fábio,<br>
      <br>
      Al 12/03/13 01:00, En/na Fábio Rabelo ha escrit:<br>
    </div><div class="im">
    <blockquote type="cite"><br>
      2.3 do not have the reliability 1.9 has !!!!<br>
      <br>
      I am struggling with it for 3 months, my deadline are gone, and I
      cannot make it work for more than 3 days without an issue ...<br>
    </blockquote>
    <br></div>
    I cannot give my opinion about 2.3 but with 2.2.x it works
    perfectly, I only had to change elevator to deadline cause CFQ had
    performance problems with our P2000 iSCSI array disk.<br>
    <br>
    As other list members asked, what are your main problems?<br>
    <br></div></blockquote><div><br>I already described the problems several times here .<br><br>This is a five node cluster, motherboards dual opteron from Supermicro .<br><br>Storage uses the same motherboard as the five nodes, but with a 16 3,5 HD slots, with 12 occupied by WD enterprise disks .<br>
<br>Storage runs Nas4Free .  ( already try Freenas, same result )<br><br>Like I said, when I installed PVE 1.9 everything works fine for, now 9 days, and counting .<br><br>In the five nodes, are embedded 2 network ports, connected to Linksys switcher, I am using it to serve the VMs .<br>
<br>In one PCIe Slot there are an Intel 10 GB card, to talk with a Supermicro 10 GB switcher, exclusive to communication between the five nodes and the Storage .<br><br>This switcher have no link with anything else .<br><br>
In the Storage, I use one of the embedded ports to manage, and all images are served through 10 GB card .<br><br>After sometime, between 1 and 3 days the system is working, the nodes stops to talk with the storage .<br><br>
When it happens, the log shows lots of msg like this :<br><br><pre>Mar  6 17:15:29 nodo-01 pvestatd[2804]: WARNING: storage 'iudice01' is not online
Mar  6 17:15:39 nodo-01 pvestatd[2804]: WARNING: storage 'iudice01' is not online
Mar  6 17:15:49 nodo-01 pvestatd[2804]: WARNING: storage 'iudice01' is not online
Mar  6 17:15:59 nodo-01 pvestatd[2804]: WARNING: storage 'iudice01' is not online
Mar  6 17:16:09 nodo-01 pvestatd[2804]: WARNING: storage 'iudice01' is not online
Mar  6 17:16:19 nodo-01 pvestatd[2804]: WARNING: storage 'iudice01' is not online
Mar  6 17:16:29 nodo-01 pvestatd[2804]: WARNING: storage 'iudice01' is not online
Mar  6 17:16:39 nodo-01 pvestatd[2804]: WARNING: storage 'iudice01' is not online
Mar  6 17:16:49 nodo-01 pvestatd[2804]: WARNING: storage 'iudice01' is not online
Mar  6 17:16:59 nodo-01 pvestatd[2804]: WARNING: storage 'iudice01' is not online</pre><br><br>After that, if I try to restart the pve daemon, it refuses to .<br><br>If I try to reboot the server, it stops when the PVE daemon should stops, and stays there forever .<br>
<br>The only way to reboot any of the nodes is a hard reset !<br><br>At first, I my suspects goes to Storage, changed from Freenas to Nas4Free, sane thing, desperation !<br><br>Then, for tests, I installed PVE 1.9 In all five nodes ( I have 2 systems running it for 3 years, so issue, this new system are to replace both )<br>
<br>Like I said, 9 days and counting !!!<br><br>So, there is no problem in the hardware, and there is no problem with Nas4Free !<br><br>What left ?!?<br><br><br>Fábio Rabelo<br><br><br></div></div>