<html>
<head>
<meta content="text/html; charset=UTF-8" http-equiv="Content-Type">
</head>
<body text="#000000" bgcolor="#FFFFFF">
<div class="moz-cite-prefix">Yeah, had similar problems under heavy
IO load when storage introduces high latencies. Maybe there's
reduced timeouts in fresh kernels.<br>
<br>
Replacing ide or virtio-blk with virtio-scsi in VM config seems to
help in most cases (and also introduces other cool features).<br>
<br>
31.12.2015 19:03, Michael Pöllinger пишет:<br>
</div>
<blockquote cite="mid:000301d143e4$bd9aac50$38d004f0$@wds-tech.de"
type="cite">
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
<meta name="Generator" content="Microsoft Word 15 (filtered
medium)">
<style><!--
/* Font Definitions */
@font-face
{font-family:"Cambria Math";
panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
{font-family:Calibri;
panose-1:2 15 5 2 2 2 4 3 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
{margin:0cm;
margin-bottom:.0001pt;
font-size:11.0pt;
font-family:"Calibri",sans-serif;
mso-fareast-language:EN-US;}
a:link, span.MsoHyperlink
{mso-style-priority:99;
color:#0563C1;
text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
{mso-style-priority:99;
color:#954F72;
text-decoration:underline;}
span.E-MailFormatvorlage17
{mso-style-type:personal-compose;
font-family:"Calibri",sans-serif;
color:windowtext;}
.MsoChpDefault
{mso-style-type:export-only;
font-family:"Calibri",sans-serif;
mso-fareast-language:EN-US;}
@page WordSection1
{size:612.0pt 792.0pt;
margin:70.85pt 70.85pt 2.0cm 70.85pt;}
div.WordSection1
{page:WordSection1;}
--></style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]-->
<div class="WordSection1">
<p class="MsoNormal">Hi mailing list members.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">We are getting strange erros in our debian
8 VMs and only inside of the VM.<o:p></o:p></p>
<p class="MsoNormal">Setup is qcow2 with LVM inside of VMs (more
details on bottom)<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">They are crashing randomly. Sometimes
multipile times a day sometimes after some days.<o:p></o:p></p>
<p class="MsoNormal">Has anyone the same problems? Or get it
solved already?<o:p></o:p></p>
<p class="MsoNormal">BTW: No errors reported by raid system.
HDDs seems to be all fine.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">kernel.log<o:p></o:p></p>
<p class="MsoNormal">[So Dez 27 05:17:44 2015] ata1.00:
exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x6 frozen<o:p></o:p></p>
<p class="MsoNormal">[So Dez 27 05:17:44 2015] ata1.00: failed
command: WRITE DMA<o:p></o:p></p>
<p class="MsoNormal">[So Dez 27 05:17:44 2015] ata1.00: cmd
ca/00:80:b8:4e:ce/00:00:00:00:00/eb tag 0 dma 65536 out res
40/00:01:00:00:00/00:00:00:00:00/a0 Emask 0x4 (timeout)<o:p></o:p></p>
<p class="MsoNormal">[So Dez 27 05:17:44 2015] ata1.00: status:
{ DRDY }<o:p></o:p></p>
<p class="MsoNormal">[So Dez 27 05:17:44 2015] ata1: soft
resetting link<o:p></o:p></p>
<p class="MsoNormal">[So Dez 27 05:17:45 2015] ata1.01: NODEV
after polling detection<o:p></o:p></p>
<p class="MsoNormal">[So Dez 27 05:17:45 2015] ata1.00:
configured for MWDMA2<o:p></o:p></p>
<p class="MsoNormal">[So Dez 27 05:17:45 2015] ata1.00: device
reported invalid CHS sector 0<o:p></o:p></p>
<p class="MsoNormal">[So Dez 27 05:17:45 2015] ata1: EH complete<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">We got multiple behaviors after that:<o:p></o:p></p>
<p class="MsoNormal">- 9 times the VM stopped working and we
need to press reset or reboot multiple times until it works<o:p></o:p></p>
<p class="MsoNormal">- 1 time we got a kernel panic after it<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Seems to be not a hardware defect, because
this problem occours also after migration to another node.<o:p></o:p></p>
<p class="MsoNormal">Strange is that all debian7 VMs running
fine. It´s only latest debian 8 getting this error.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">pveversion<o:p></o:p></p>
<p class="MsoNormal">------------------------<o:p></o:p></p>
<p class="MsoNormal">proxmox-ve-2.6.32: 3.4-166 (running kernel:
2.6.32-43-pve)<o:p></o:p></p>
<p class="MsoNormal">pve-manager: 3.4-11 (running version:
3.4-11/6502936f)<o:p></o:p></p>
<p class="MsoNormal">pve-kernel-2.6.32-39-pve: 2.6.32-157<o:p></o:p></p>
<p class="MsoNormal">pve-kernel-2.6.32-37-pve: 2.6.32-150<o:p></o:p></p>
<p class="MsoNormal">pve-kernel-2.6.32-43-pve: 2.6.32-166<o:p></o:p></p>
<p class="MsoNormal">lvm2: 2.02.98-pve4<o:p></o:p></p>
<p class="MsoNormal">clvm: 2.02.98-pve4<o:p></o:p></p>
<p class="MsoNormal">corosync-pve: 1.4.7-1<o:p></o:p></p>
<p class="MsoNormal">openais-pve: 1.1.4-3<o:p></o:p></p>
<p class="MsoNormal">libqb0: 0.11.1-2<o:p></o:p></p>
<p class="MsoNormal">redhat-cluster-pve: 3.2.0-2<o:p></o:p></p>
<p class="MsoNormal">resource-agents-pve: 3.9.2-4<o:p></o:p></p>
<p class="MsoNormal">fence-agents-pve: 4.0.10-3<o:p></o:p></p>
<p class="MsoNormal">pve-cluster: 3.0-19<o:p></o:p></p>
<p class="MsoNormal">qemu-server: 3.4-6<o:p></o:p></p>
<p class="MsoNormal">pve-firmware: 1.1-5<o:p></o:p></p>
<p class="MsoNormal">libpve-common-perl: 3.0-24<o:p></o:p></p>
<p class="MsoNormal">libpve-access-control: 3.0-16<o:p></o:p></p>
<p class="MsoNormal">libpve-storage-perl: 3.0-34<o:p></o:p></p>
<p class="MsoNormal">pve-libspice-server1: 0.12.4-3<o:p></o:p></p>
<p class="MsoNormal">vncterm: 1.1-8<o:p></o:p></p>
<p class="MsoNormal">vzctl: 4.0-1pve6<o:p></o:p></p>
<p class="MsoNormal">vzprocps: 2.0.11-2<o:p></o:p></p>
<p class="MsoNormal">vzquota: 3.1-2<o:p></o:p></p>
<p class="MsoNormal">pve-qemu-kvm: 2.2-14<o:p></o:p></p>
<p class="MsoNormal">ksm-control-daemon: 1.1-1<o:p></o:p></p>
<p class="MsoNormal">glusterfs-client: 3.5.2-1<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">pvperf<o:p></o:p></p>
<p class="MsoNormal">------------------------<o:p></o:p></p>
<p class="MsoNormal">root@server14:/var/lib/vz# pveperf
/var/lib/vz<o:p></o:p></p>
<p class="MsoNormal">CPU BOGOMIPS: 55203.24<o:p></o:p></p>
<p class="MsoNormal">REGEX/SECOND: 946969<o:p></o:p></p>
<p class="MsoNormal">HD SIZE: 2605.33 GB
(/dev/mapper/pve-data)<o:p></o:p></p>
<p class="MsoNormal">BUFFERED READS: 130.43 MB/sec<o:p></o:p></p>
<p class="MsoNormal">AVERAGE SEEK TIME: 17.61 ms<o:p></o:p></p>
<p class="MsoNormal">FSYNCS/SECOND: 811.25<o:p></o:p></p>
<p class="MsoNormal">DNS EXT: 53.06 ms<o:p></o:p></p>
<p class="MsoNormal">DNS INT: 50.92 ms (xxx)<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">vmXXX.conf<o:p></o:p></p>
<p class="MsoNormal">------------------------<o:p></o:p></p>
<p class="MsoNormal">#[hostname]<o:p></o:p></p>
<p class="MsoNormal">#[IP]<o:p></o:p></p>
<p class="MsoNormal">#<o:p></o:p></p>
<p class="MsoNormal">boot: cdn<o:p></o:p></p>
<p class="MsoNormal">bootdisk: ide0<o:p></o:p></p>
<p class="MsoNormal">cores: 2<o:p></o:p></p>
<p class="MsoNormal">ide0:
local:110/vm-110-disk-1.qcow2,format=qcow2,cache=writethrough,size=201G<o:p></o:p></p>
<p class="MsoNormal">ide2:
server16:iso/systemrescuecd-x86-4.6.1.iso,media=cdrom,size=459502K<o:p></o:p></p>
<p class="MsoNormal">memory: 4096<o:p></o:p></p>
<p class="MsoNormal">name: [FQDN]<o:p></o:p></p>
<p class="MsoNormal">net0:
e1000=CE:C8:FE:B3:56:F8,bridge=vmbr0,firewall=1<o:p></o:p></p>
<p class="MsoNormal">numa: 0<o:p></o:p></p>
<p class="MsoNormal">onboot: 1<o:p></o:p></p>
<p class="MsoNormal">ostype: l26<o:p></o:p></p>
<p class="MsoNormal">smbios1:
uuid=d5bc6275-b25a-4523-b927-0d0098a7cb74<o:p></o:p></p>
<p class="MsoNormal">sockets: 1<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Hardware info<o:p></o:p></p>
<p class="MsoNormal">------------------------<o:p></o:p></p>
<p class="MsoNormal">AMD Opteron(tm) Processor 6176 12 cores<o:p></o:p></p>
<p class="MsoNormal">Supermicro H8SGL<o:p></o:p></p>
<p class="MsoNormal">Adaptec 5405Z with ZMCP<o:p></o:p></p>
<p class="MsoNormal">2 x HGST HDN724030AL as RAID 1<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">All updated to the latest versions.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Here the next crash of the VMs, all with
same error messages:<o:p></o:p></p>
<p class="MsoNormal">-------------------------------------------
<o:p></o:p></p>
<p class="MsoNormal">kernel: [242495.848207] ata1.00: exception
Emask 0x0 SAct 0x0 SErr 0x0 action 0x6 frozen<o:p></o:p></p>
<p class="MsoNormal">kernel: [242495.849075] ata1.00: failed
command: FLUSH CACHE<o:p></o:p></p>
<p class="MsoNormal">kernel: [242495.849772] ata1.00: cmd
e7/00:00:00:00:00/00:00:00:00:00/a0 tag 0<o:p></o:p></p>
<p class="MsoNormal">kernel: [242495.849772] res
40/00:01:00:00:00/00:00:00:00:00/a0 Emask 0x4 (timeout)<o:p></o:p></p>
<p class="MsoNormal">kernel: [242495.851831] ata1.00: status: {
DRDY }<o:p></o:p></p>
<p class="MsoNormal">kernel: [242500.892182] ata1: link is slow
to respond, please be patient (ready=0)<o:p></o:p></p>
<p class="MsoNormal">kernel: [242505.876134] ata1: device not
ready (errno=-16), forcing hardreset<o:p></o:p></p>
<p class="MsoNormal">kernel: [242505.876246] ata1: soft
resetting link<o:p></o:p></p>
<p class="MsoNormal">kernel: [242506.033244] ata1.00: configured
for MWDMA2<o:p></o:p></p>
<p class="MsoNormal">kernel: [242506.033252] ata1.00: retrying
FLUSH 0xe7 Emask 0x4<o:p></o:p></p>
<p class="MsoNormal">kernel: [242506.033620] ata1.00: device
reported invalid CHS sector 0<o:p></o:p></p>
<p class="MsoNormal">kernel: [242506.033632] ata1: EH complete<o:p></o:p></p>
<p class="MsoNormal">kernel: [255097.832155] ata1.00: exception
Emask 0x0 SAct 0x0 SErr 0x0 action 0x6 frozen<o:p></o:p></p>
<p class="MsoNormal">kernel: [255097.833034] ata1.00: failed
command: FLUSH CACHE<o:p></o:p></p>
<p class="MsoNormal">kernel: [255097.833744] ata1.00: cmd
e7/00:00:00:00:00/00:00:00:00:00/a0 tag 0<o:p></o:p></p>
<p class="MsoNormal">kernel: [255097.833744] res
40/00:01:00:00:00/00:00:00:00:00/a0 Emask 0x4 (timeout)<o:p></o:p></p>
<p class="MsoNormal">kernel: [255097.835810] ata1.00: status: {
DRDY }<o:p></o:p></p>
<p class="MsoNormal">kernel: [255102.876126] ata1: link is slow
to respond, please be patient (ready=0)<o:p></o:p></p>
<p class="MsoNormal">kernel: [255107.860130] ata1: device not
ready (errno=-16), forcing hardreset<o:p></o:p></p>
<p class="MsoNormal">kernel: [255107.860153] ata1: soft
resetting link<o:p></o:p></p>
<p class="MsoNormal">kernel: [255108.017093] ata1.00: configured
for MWDMA2<o:p></o:p></p>
<p class="MsoNormal">kernel: [255108.017113] ata1.00: retrying
FLUSH 0xe7 Emask 0x4<o:p></o:p></p>
<p class="MsoNormal">kernel: [255108.017537] ata1.00: device
reported invalid CHS sector 0<o:p></o:p></p>
<p class="MsoNormal">kernel: [255108.017550] ata1: EH complete<o:p></o:p></p>
<p class="MsoNormal">kernel: [309438.824333] ata1.00: exception
Emask 0x0 SAct 0x0 SErr 0x0 action 0x6 frozen<o:p></o:p></p>
<p class="MsoNormal">kernel: [309438.825198] ata1.00: failed
command: FLUSH CACHE<o:p></o:p></p>
<p class="MsoNormal">kernel: [309438.825921] ata1.00: cmd
e7/00:00:00:00:00/00:00:00:00:00/a0 tag 0<o:p></o:p></p>
<p class="MsoNormal">kernel: [309438.825921] res
40/00:01:00:00:00/00:00:00:00:00/a0 Emask 0x4 (timeout)<o:p></o:p></p>
<p class="MsoNormal">kernel: [309438.827996] ata1.00: status: {
DRDY }<o:p></o:p></p>
<p class="MsoNormal">kernel: [309443.868140] ata1: link is slow
to respond, please be patient (ready=0)<o:p></o:p></p>
<p class="MsoNormal">kernel: [309448.852147] ata1: device not
ready (errno=-16), forcing hardreset<o:p></o:p></p>
<p class="MsoNormal">kernel: [309448.852175] ata1: soft
resetting link<o:p></o:p></p>
<p class="MsoNormal">kernel: [309449.009123] ata1.00: configured
for MWDMA2<o:p></o:p></p>
<p class="MsoNormal">kernel: [309449.009129] ata1.00: retrying
FLUSH 0xe7 Emask 0x4<o:p></o:p></p>
<p class="MsoNormal">kernel: [309449.009532] ata1.00: device
reported invalid CHS sector 0<o:p></o:p></p>
<p class="MsoNormal">kernel: [309449.009545] ata1: EH complete<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">kind regards and happy about any hint<o:p></o:p></p>
<p class="MsoNormal">Michael<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<br>
<fieldset class="mimeAttachmentHeader"></fieldset>
<br>
<pre wrap="">_______________________________________________
pve-user mailing list
<a class="moz-txt-link-abbreviated" href="mailto:pve-user@pve.proxmox.com">pve-user@pve.proxmox.com</a>
<a class="moz-txt-link-freetext" href="http://pve.proxmox.com/cgi-bin/mailman/listinfo/pve-user">http://pve.proxmox.com/cgi-bin/mailman/listinfo/pve-user</a>
</pre>
</blockquote>
<br>
</body>
</html>