<html>
  <head>
    <meta content="text/html; charset=UTF-8" http-equiv="Content-Type">
  </head>
  <body text="#000000" bgcolor="#FFFFFF">
    <div class="moz-cite-prefix">Yeah, had similar problems under heavy
      IO load when storage introduces high latencies. Maybe there's
      reduced timeouts in fresh kernels.<br>
      <br>
      Replacing ide or virtio-blk with virtio-scsi in VM config seems to
      help in most cases (and also introduces other cool features).<br>
      <br>
      31.12.2015 19:03, Michael Pöllinger пишет:<br>
    </div>
    <blockquote cite="mid:000301d143e4$bd9aac50$38d004f0$@wds-tech.de"
      type="cite">
      <meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
      <meta name="Generator" content="Microsoft Word 15 (filtered
        medium)">
      <style><!--
/* Font Definitions */
@font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0cm;
        margin-bottom:.0001pt;
        font-size:11.0pt;
        font-family:"Calibri",sans-serif;
        mso-fareast-language:EN-US;}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:#0563C1;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:#954F72;
        text-decoration:underline;}
span.E-MailFormatvorlage17
        {mso-style-type:personal-compose;
        font-family:"Calibri",sans-serif;
        color:windowtext;}
.MsoChpDefault
        {mso-style-type:export-only;
        font-family:"Calibri",sans-serif;
        mso-fareast-language:EN-US;}
@page WordSection1
        {size:612.0pt 792.0pt;
        margin:70.85pt 70.85pt 2.0cm 70.85pt;}
div.WordSection1
        {page:WordSection1;}
--></style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]-->
      <div class="WordSection1">
        <p class="MsoNormal">Hi mailing list members.<o:p></o:p></p>
        <p class="MsoNormal"><o:p> </o:p></p>
        <p class="MsoNormal">We are getting strange erros in our debian
          8 VMs and only inside of the VM.<o:p></o:p></p>
        <p class="MsoNormal">Setup is qcow2 with LVM inside of VMs (more
          details on bottom)<o:p></o:p></p>
        <p class="MsoNormal"><o:p> </o:p></p>
        <p class="MsoNormal">They are crashing randomly. Sometimes
          multipile times a day sometimes after some days.<o:p></o:p></p>
        <p class="MsoNormal">Has anyone the same problems? Or get it
          solved already?<o:p></o:p></p>
        <p class="MsoNormal">BTW: No errors reported by raid system.
          HDDs seems to be all fine.<o:p></o:p></p>
        <p class="MsoNormal"><o:p> </o:p></p>
        <p class="MsoNormal">kernel.log<o:p></o:p></p>
        <p class="MsoNormal">[So Dez 27 05:17:44 2015] ata1.00:
          exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x6 frozen<o:p></o:p></p>
        <p class="MsoNormal">[So Dez 27 05:17:44 2015] ata1.00: failed
          command: WRITE DMA<o:p></o:p></p>
        <p class="MsoNormal">[So Dez 27 05:17:44 2015] ata1.00: cmd
          ca/00:80:b8:4e:ce/00:00:00:00:00/eb tag 0 dma 65536 out res
          40/00:01:00:00:00/00:00:00:00:00/a0 Emask 0x4 (timeout)<o:p></o:p></p>
        <p class="MsoNormal">[So Dez 27 05:17:44 2015] ata1.00: status:
          { DRDY }<o:p></o:p></p>
        <p class="MsoNormal">[So Dez 27 05:17:44 2015] ata1: soft
          resetting link<o:p></o:p></p>
        <p class="MsoNormal">[So Dez 27 05:17:45 2015] ata1.01: NODEV
          after polling detection<o:p></o:p></p>
        <p class="MsoNormal">[So Dez 27 05:17:45 2015] ata1.00:
          configured for MWDMA2<o:p></o:p></p>
        <p class="MsoNormal">[So Dez 27 05:17:45 2015] ata1.00: device
          reported invalid CHS sector 0<o:p></o:p></p>
        <p class="MsoNormal">[So Dez 27 05:17:45 2015] ata1: EH complete<o:p></o:p></p>
        <p class="MsoNormal"><o:p> </o:p></p>
        <p class="MsoNormal">We got multiple behaviors after that:<o:p></o:p></p>
        <p class="MsoNormal">- 9 times the VM stopped working and we
          need to press reset or reboot multiple times until it works<o:p></o:p></p>
        <p class="MsoNormal">- 1 time we got a kernel panic after it<o:p></o:p></p>
        <p class="MsoNormal"><o:p> </o:p></p>
        <p class="MsoNormal">Seems to be not a hardware defect, because
          this problem occours also after migration to another node.<o:p></o:p></p>
        <p class="MsoNormal">Strange is that all debian7 VMs running
          fine. It´s only latest debian 8 getting this error.<o:p></o:p></p>
        <p class="MsoNormal"><o:p> </o:p></p>
        <p class="MsoNormal">pveversion<o:p></o:p></p>
        <p class="MsoNormal">------------------------<o:p></o:p></p>
        <p class="MsoNormal">proxmox-ve-2.6.32: 3.4-166 (running kernel:
          2.6.32-43-pve)<o:p></o:p></p>
        <p class="MsoNormal">pve-manager: 3.4-11 (running version:
          3.4-11/6502936f)<o:p></o:p></p>
        <p class="MsoNormal">pve-kernel-2.6.32-39-pve: 2.6.32-157<o:p></o:p></p>
        <p class="MsoNormal">pve-kernel-2.6.32-37-pve: 2.6.32-150<o:p></o:p></p>
        <p class="MsoNormal">pve-kernel-2.6.32-43-pve: 2.6.32-166<o:p></o:p></p>
        <p class="MsoNormal">lvm2: 2.02.98-pve4<o:p></o:p></p>
        <p class="MsoNormal">clvm: 2.02.98-pve4<o:p></o:p></p>
        <p class="MsoNormal">corosync-pve: 1.4.7-1<o:p></o:p></p>
        <p class="MsoNormal">openais-pve: 1.1.4-3<o:p></o:p></p>
        <p class="MsoNormal">libqb0: 0.11.1-2<o:p></o:p></p>
        <p class="MsoNormal">redhat-cluster-pve: 3.2.0-2<o:p></o:p></p>
        <p class="MsoNormal">resource-agents-pve: 3.9.2-4<o:p></o:p></p>
        <p class="MsoNormal">fence-agents-pve: 4.0.10-3<o:p></o:p></p>
        <p class="MsoNormal">pve-cluster: 3.0-19<o:p></o:p></p>
        <p class="MsoNormal">qemu-server: 3.4-6<o:p></o:p></p>
        <p class="MsoNormal">pve-firmware: 1.1-5<o:p></o:p></p>
        <p class="MsoNormal">libpve-common-perl: 3.0-24<o:p></o:p></p>
        <p class="MsoNormal">libpve-access-control: 3.0-16<o:p></o:p></p>
        <p class="MsoNormal">libpve-storage-perl: 3.0-34<o:p></o:p></p>
        <p class="MsoNormal">pve-libspice-server1: 0.12.4-3<o:p></o:p></p>
        <p class="MsoNormal">vncterm: 1.1-8<o:p></o:p></p>
        <p class="MsoNormal">vzctl: 4.0-1pve6<o:p></o:p></p>
        <p class="MsoNormal">vzprocps: 2.0.11-2<o:p></o:p></p>
        <p class="MsoNormal">vzquota: 3.1-2<o:p></o:p></p>
        <p class="MsoNormal">pve-qemu-kvm: 2.2-14<o:p></o:p></p>
        <p class="MsoNormal">ksm-control-daemon: 1.1-1<o:p></o:p></p>
        <p class="MsoNormal">glusterfs-client: 3.5.2-1<o:p></o:p></p>
        <p class="MsoNormal"><o:p> </o:p></p>
        <p class="MsoNormal"><o:p> </o:p></p>
        <p class="MsoNormal">pvperf<o:p></o:p></p>
        <p class="MsoNormal">------------------------<o:p></o:p></p>
        <p class="MsoNormal">root@server14:/var/lib/vz# pveperf
          /var/lib/vz<o:p></o:p></p>
        <p class="MsoNormal">CPU BOGOMIPS:      55203.24<o:p></o:p></p>
        <p class="MsoNormal">REGEX/SECOND:      946969<o:p></o:p></p>
        <p class="MsoNormal">HD SIZE:           2605.33 GB
          (/dev/mapper/pve-data)<o:p></o:p></p>
        <p class="MsoNormal">BUFFERED READS:    130.43 MB/sec<o:p></o:p></p>
        <p class="MsoNormal">AVERAGE SEEK TIME: 17.61 ms<o:p></o:p></p>
        <p class="MsoNormal">FSYNCS/SECOND:     811.25<o:p></o:p></p>
        <p class="MsoNormal">DNS EXT:           53.06 ms<o:p></o:p></p>
        <p class="MsoNormal">DNS INT:           50.92 ms (xxx)<o:p></o:p></p>
        <p class="MsoNormal"><o:p> </o:p></p>
        <p class="MsoNormal"><o:p> </o:p></p>
        <p class="MsoNormal">vmXXX.conf<o:p></o:p></p>
        <p class="MsoNormal">------------------------<o:p></o:p></p>
        <p class="MsoNormal">#[hostname]<o:p></o:p></p>
        <p class="MsoNormal">#[IP]<o:p></o:p></p>
        <p class="MsoNormal">#<o:p></o:p></p>
        <p class="MsoNormal">boot: cdn<o:p></o:p></p>
        <p class="MsoNormal">bootdisk: ide0<o:p></o:p></p>
        <p class="MsoNormal">cores: 2<o:p></o:p></p>
        <p class="MsoNormal">ide0:
          local:110/vm-110-disk-1.qcow2,format=qcow2,cache=writethrough,size=201G<o:p></o:p></p>
        <p class="MsoNormal">ide2:
          server16:iso/systemrescuecd-x86-4.6.1.iso,media=cdrom,size=459502K<o:p></o:p></p>
        <p class="MsoNormal">memory: 4096<o:p></o:p></p>
        <p class="MsoNormal">name: [FQDN]<o:p></o:p></p>
        <p class="MsoNormal">net0:
          e1000=CE:C8:FE:B3:56:F8,bridge=vmbr0,firewall=1<o:p></o:p></p>
        <p class="MsoNormal">numa: 0<o:p></o:p></p>
        <p class="MsoNormal">onboot: 1<o:p></o:p></p>
        <p class="MsoNormal">ostype: l26<o:p></o:p></p>
        <p class="MsoNormal">smbios1:
          uuid=d5bc6275-b25a-4523-b927-0d0098a7cb74<o:p></o:p></p>
        <p class="MsoNormal">sockets: 1<o:p></o:p></p>
        <p class="MsoNormal"><o:p> </o:p></p>
        <p class="MsoNormal"><o:p> </o:p></p>
        <p class="MsoNormal">Hardware info<o:p></o:p></p>
        <p class="MsoNormal">------------------------<o:p></o:p></p>
        <p class="MsoNormal">AMD Opteron(tm) Processor 6176 12 cores<o:p></o:p></p>
        <p class="MsoNormal">Supermicro H8SGL<o:p></o:p></p>
        <p class="MsoNormal">Adaptec 5405Z with ZMCP<o:p></o:p></p>
        <p class="MsoNormal">2 x HGST HDN724030AL as RAID 1<o:p></o:p></p>
        <p class="MsoNormal"><o:p> </o:p></p>
        <p class="MsoNormal">All updated to the latest versions.<o:p></o:p></p>
        <p class="MsoNormal"><o:p> </o:p></p>
        <p class="MsoNormal"><o:p> </o:p></p>
        <p class="MsoNormal"><o:p> </o:p></p>
        <p class="MsoNormal">Here the next crash of the VMs, all with
          same error messages:<o:p></o:p></p>
        <p class="MsoNormal">-------------------------------------------
          <o:p></o:p></p>
        <p class="MsoNormal">kernel: [242495.848207] ata1.00: exception
          Emask 0x0 SAct 0x0 SErr 0x0 action 0x6 frozen<o:p></o:p></p>
        <p class="MsoNormal">kernel: [242495.849075] ata1.00: failed
          command: FLUSH CACHE<o:p></o:p></p>
        <p class="MsoNormal">kernel: [242495.849772] ata1.00: cmd
          e7/00:00:00:00:00/00:00:00:00:00/a0 tag 0<o:p></o:p></p>
        <p class="MsoNormal">kernel: [242495.849772]          res
          40/00:01:00:00:00/00:00:00:00:00/a0 Emask 0x4 (timeout)<o:p></o:p></p>
        <p class="MsoNormal">kernel: [242495.851831] ata1.00: status: {
          DRDY }<o:p></o:p></p>
        <p class="MsoNormal">kernel: [242500.892182] ata1: link is slow
          to respond, please be patient (ready=0)<o:p></o:p></p>
        <p class="MsoNormal">kernel: [242505.876134] ata1: device not
          ready (errno=-16), forcing hardreset<o:p></o:p></p>
        <p class="MsoNormal">kernel: [242505.876246] ata1: soft
          resetting link<o:p></o:p></p>
        <p class="MsoNormal">kernel: [242506.033244] ata1.00: configured
          for MWDMA2<o:p></o:p></p>
        <p class="MsoNormal">kernel: [242506.033252] ata1.00: retrying
          FLUSH 0xe7 Emask 0x4<o:p></o:p></p>
        <p class="MsoNormal">kernel: [242506.033620] ata1.00: device
          reported invalid CHS sector 0<o:p></o:p></p>
        <p class="MsoNormal">kernel: [242506.033632] ata1: EH complete<o:p></o:p></p>
        <p class="MsoNormal">kernel: [255097.832155] ata1.00: exception
          Emask 0x0 SAct 0x0 SErr 0x0 action 0x6 frozen<o:p></o:p></p>
        <p class="MsoNormal">kernel: [255097.833034] ata1.00: failed
          command: FLUSH CACHE<o:p></o:p></p>
        <p class="MsoNormal">kernel: [255097.833744] ata1.00: cmd
          e7/00:00:00:00:00/00:00:00:00:00/a0 tag 0<o:p></o:p></p>
        <p class="MsoNormal">kernel: [255097.833744]          res
          40/00:01:00:00:00/00:00:00:00:00/a0 Emask 0x4 (timeout)<o:p></o:p></p>
        <p class="MsoNormal">kernel: [255097.835810] ata1.00: status: {
          DRDY }<o:p></o:p></p>
        <p class="MsoNormal">kernel: [255102.876126] ata1: link is slow
          to respond, please be patient (ready=0)<o:p></o:p></p>
        <p class="MsoNormal">kernel: [255107.860130] ata1: device not
          ready (errno=-16), forcing hardreset<o:p></o:p></p>
        <p class="MsoNormal">kernel: [255107.860153] ata1: soft
          resetting link<o:p></o:p></p>
        <p class="MsoNormal">kernel: [255108.017093] ata1.00: configured
          for MWDMA2<o:p></o:p></p>
        <p class="MsoNormal">kernel: [255108.017113] ata1.00: retrying
          FLUSH 0xe7 Emask 0x4<o:p></o:p></p>
        <p class="MsoNormal">kernel: [255108.017537] ata1.00: device
          reported invalid CHS sector 0<o:p></o:p></p>
        <p class="MsoNormal">kernel: [255108.017550] ata1: EH complete<o:p></o:p></p>
        <p class="MsoNormal">kernel: [309438.824333] ata1.00: exception
          Emask 0x0 SAct 0x0 SErr 0x0 action 0x6 frozen<o:p></o:p></p>
        <p class="MsoNormal">kernel: [309438.825198] ata1.00: failed
          command: FLUSH CACHE<o:p></o:p></p>
        <p class="MsoNormal">kernel: [309438.825921] ata1.00: cmd
          e7/00:00:00:00:00/00:00:00:00:00/a0 tag 0<o:p></o:p></p>
        <p class="MsoNormal">kernel: [309438.825921]          res
          40/00:01:00:00:00/00:00:00:00:00/a0 Emask 0x4 (timeout)<o:p></o:p></p>
        <p class="MsoNormal">kernel: [309438.827996] ata1.00: status: {
          DRDY }<o:p></o:p></p>
        <p class="MsoNormal">kernel: [309443.868140] ata1: link is slow
          to respond, please be patient (ready=0)<o:p></o:p></p>
        <p class="MsoNormal">kernel: [309448.852147] ata1: device not
          ready (errno=-16), forcing hardreset<o:p></o:p></p>
        <p class="MsoNormal">kernel: [309448.852175] ata1: soft
          resetting link<o:p></o:p></p>
        <p class="MsoNormal">kernel: [309449.009123] ata1.00: configured
          for MWDMA2<o:p></o:p></p>
        <p class="MsoNormal">kernel: [309449.009129] ata1.00: retrying
          FLUSH 0xe7 Emask 0x4<o:p></o:p></p>
        <p class="MsoNormal">kernel: [309449.009532] ata1.00: device
          reported invalid CHS sector 0<o:p></o:p></p>
        <p class="MsoNormal">kernel: [309449.009545] ata1: EH complete<o:p></o:p></p>
        <p class="MsoNormal"><o:p> </o:p></p>
        <p class="MsoNormal">kind regards and happy about any hint<o:p></o:p></p>
        <p class="MsoNormal">Michael<o:p></o:p></p>
        <p class="MsoNormal"><o:p> </o:p></p>
      </div>
      <br>
      <fieldset class="mimeAttachmentHeader"></fieldset>
      <br>
      <pre wrap="">_______________________________________________
pve-user mailing list
<a class="moz-txt-link-abbreviated" href="mailto:pve-user@pve.proxmox.com">pve-user@pve.proxmox.com</a>
<a class="moz-txt-link-freetext" href="http://pve.proxmox.com/cgi-bin/mailman/listinfo/pve-user">http://pve.proxmox.com/cgi-bin/mailman/listinfo/pve-user</a>
</pre>
    </blockquote>
    <br>
  </body>
</html>