<![CDATA[Latest posts for the topic "Phân tích log trong CentOS, máy chủ lỗi phần cứng."]]> /hvaonline/posts/list/24.html JForum - http://www.jforum.net Phân tích log trong CentOS, máy chủ lỗi phần cứng. Code:
Hardware event. This is not a software error.
MCE 1
CPU 8 BANK 9
TIME 1393227192 Mon Feb 24 14:33:12 2014
MCG status:
MCi status:
Corrected error
Error enabled
MCA: MEMORY CONTROLLER GEN_CHANNELunspecified_ERR
Transaction: Generic undefined request
STATUS 900000400012008f MCGSTATUS 0
MCGCAP 1000c18 APICID 40 SOCKETID 1
CPUID Vendor Intel Family 6 Model 47
Chạy lệnh mcelog --client Code:
Memory errors
SOCKET 1 CHANNEL any DIMM any
corrected memory errors:
    681025 total
    0 in 24h
uncorrected memory errors:
    0 total
    0 in 24h
Xem /var/log/messages Code:
Feb 24 14:31:54 mail kernel: [Hardware Error]: Machine check events logged
Feb 24 14:31:54 mail kernel: [Hardware Error]: Machine check events logged
Feb 24 14:32:55 mail kernel: __ratelimit: 12277 callbacks suppressed
Feb 24 14:32:55 mail kernel: [Hardware Error]: Machine check events logged
Feb 24 14:32:55 mail kernel: [Hardware Error]: Machine check events logged
Feb 24 14:33:55 mail kernel: __ratelimit: 12020 callbacks suppressed
Feb 24 14:33:55 mail kernel: [Hardware Error]: Machine check events logged
Feb 24 14:33:55 mail kernel: [Hardware Error]: Machine check events logged
Nhờ các bạn xem và giúp mình phân tích lỗi với, mình chỉ biết là nó bị lỗi phần cứng nhưng chưa dám khẳng định là bị lỗi ở đâu.]]>
/hvaonline/posts/list/45618.html#280546 /hvaonline/posts/list/45618.html#280546 GMT
Phân tích log trong CentOS, máy chủ lỗi phần cứng. /hvaonline/posts/list/45618.html#280552 /hvaonline/posts/list/45618.html#280552 GMT Phân tích log trong CentOS, máy chủ lỗi phần cứng. /hvaonline/posts/list/45618.html#280557 /hvaonline/posts/list/45618.html#280557 GMT Phân tích log trong CentOS, máy chủ lỗi phần cứng. /hvaonline/posts/list/45618.html#280561 /hvaonline/posts/list/45618.html#280561 GMT Phân tích log trong CentOS, máy chủ lỗi phần cứng. Code:
mc0: csrow1:[color=red] CPU_SrcID#0_Channel#1_DIMM#0:[/color] 1 Corrected Errors

sbridge: HANDLING MCE MEMORY ERROR
CPU 0: Machine Check Exception: 0 Bank 5: 8c00004000010091
TSC 0 ADDR 223cabac0 MISC 2040282886 PROCESSOR 0:206d7 TIME 1397173447 SOCKET 0 APIC 0
EDAC MC0: CE row 1, channel 0, label "CPU_SrcID#0_Channel#1_DIMM#0": 1 Unknown error(s): memory read on FATAL area : cpu=0 Err=0001:0091 (ch=1), addr = 0x223cabac0 => socket=0, Channel=1(mask=2), rank=1
Thì mình cũng chỉ dám phỏng đoán là thanh có index = 0 (tức thanh số 1) của rãnh đầu tiên => cũng chỉ là phỏng đoán thôi. Mình có làm việc với một số nhà cung cấp server thì thường khi mình báo lỗi và ko thể xác định đc thanh nào lỗi họ thưởng đổi cho mình cả 4 thanh luôn. Nên mình nghĩ ko có vấn đề gì khi bạn ko thể xác định thanh nào lỗi, chỉ hơi phiền là bạn ở tỉnh thôi.]]>
/hvaonline/posts/list/45618.html#280562 /hvaonline/posts/list/45618.html#280562 GMT
Phân tích log trong CentOS, máy chủ lỗi phần cứng. /hvaonline/posts/list/45618.html#280564 /hvaonline/posts/list/45618.html#280564 GMT Phân tích log trong CentOS, máy chủ lỗi phần cứng. /hvaonline/posts/list/45618.html#280568 /hvaonline/posts/list/45618.html#280568 GMT