Страница 1 из 1
Очень странно видёт себя веник ... наверное здохнет
Добавлено: 19 апр 2006, 00:14
kif0rt
Вообщем сидел я как обычно, делал всё как обычно, ничего абсолютно и близкого ко всяким экстремальным штукам не делал и даже не думал. И бац на ровном месте слушу веник издал звук -- такой звук слышен при отключении питания на венике, т.е. он как-будто замер. И вся ось естественно замерла ... я пошевелил мышкой, нажал на клаву , вроде что-ьто начинало пробуждаться, НО полетели отовсюду дикие ошибки I/O. Файл который я качал wget'ом был экстренно завершён с ошибкой ... Система перешда в ro. Через некоторое врямя всё перестало работать .. помогла только ALT+SYSRQ+B .. После ребута я охерел ... DISK NOT FOUND или что-то типа того PRESS ENTER FOR BOOTING или что-то типа того. Короче веника он вообще не видит. Т.е. и BIOS его не видел. Помогло вытыркивание, а потом втыркивание шлейфа .. вроде нормально. НУ, думаю, глюкануло что-то ... А через час где-то всё опять повоторилось. Опять пришлось шлейф доставать...
Не знаю что и делать ...
OS : Ubuntu 5.10
Kernel : 2.6.12-10-386
HDD: /dev/hda:
Код: Выделить всё
Model=SAMSUNG SP1614N, FwRev=TM100-30, SerialNo=S016J10Y223836
Config={ HardSect NotMFM HdSw>15uSec Fixed DTR>10Mbs }
RawCHS=16383/16/63, TrkSize=34902, SectSize=554, ECCbytes=4
BuffType=DualPortCache, BuffSize=8192kB, MaxMultSect=16, MultSect=16
CurCHS=65535/1/63, CurSects=4128705, LBA=yes, LBAsects=268435455
IORDY=on/off, tPIO={min:240,w/IORDY:120}, tDMA={min:120,rec:120}
PIO modes: pio0 pio1 pio2 pio3 pio4
DMA modes: mdma0 mdma1 mdma2
UDMA modes: udma0 udma1 udma2 udma3 udma4 *udma5
AdvancedPM=no WriteCache=enabled
Drive conforms to: (null):
* signifies the current active mode
Глюк ядра, убунты? Или вообще моё железо старое ? А что тогда из железяк могло такого накрыться ? Очень маловероятно т.к. я уже давно сижу на ээтой конфигурации и никогда таких глюков не было. Или может веник скоро здохнет ? Это более печально конечно, но я в этом варианте более чем уверен ...
Добавлено: 19 апр 2006, 09:03
Llama
смтри smart на венике для начала...
Добавлено: 19 апр 2006, 10:31
Flying
Когда мощности БП не хватает, похожим образом винт может себя вести. Никаких девайсов не добавлял в последнее время, которые могли увеличить потребление энергии?
Добавлено: 19 апр 2006, 11:35
Foxx
у гнусмасов замечены подобные закономерности у 1614 и 1634 моделей. иногда отваливается DMA. смарт при этом показывает здоровый статус. девайсы оч чувствительны к нехватке питания.
Добавлено: 19 апр 2006, 12:19
kif0rt
Блок на 235W. Ничего нового не добавлял. Раньше никаких проблем не было ... хотя я и не исключаю нехватку питания.
наверное всё-таки дело в винте ...
А вот и инфа по смарту (извиняюсь за размер, но ... может это поможет в разрешении проблемы) :
Код: Выделить всё
smartctl version 5.32 Copyright (C) 2002-4 Bruce Allen
Home page is http://smartmontools.sourceforge.net/
=== START OF INFORMATION SECTION ===
Device Model: SAMSUNG SP1614N
Serial Number: S016J10Y223836
Firmware Version: TM100-30
Device is: In smartctl database [for details use: -P show]
ATA Version is: 7
ATA Standard is: ATA/ATAPI-7 T13 1532D revision 0
Local Time is: Wed Apr 19 12:17:15 2006 EEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
General SMART Values:
Offline data collection status: (0x00) Offline data collection activity
was never started.
Auto Offline Data Collection: Disabled.
Self-test execution status: ( 0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: (6000) seconds.
Offline data collection
capabilities: (0x1b) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
No Conveyance Self-test supported.
No Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
No General Purpose Logging support.
Short self-test routine
recommended polling time: ( 1) minutes.
Extended self-test routine
recommended polling time: ( 100) minutes.
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 100 100 051 Pre-fail Always - 0
3 Spin_Up_Time 0x0007 100 091 025 Pre-fail Always - 5440
4 Start_Stop_Count 0x0032 098 098 000 Old_age Always - 2984
5 Reallocated_Sector_Ct 0x0033 100 100 011 Pre-fail Always - 0
7 Seek_Error_Rate 0x000f 100 100 051 Pre-fail Always - 0
8 Seek_Time_Performance 0x0025 100 100 015 Pre-fail Offline - 0
9 Power_On_Half_Minutes 0x0032 100 100 000 Old_age Always - 3171h+30m
10 Spin_Retry_Count 0x0033 100 100 051 Pre-fail Always - 0
11 Calibration_Retry_Count 0x0012 100 100 000 Old_age Always - 0
12 Power_Cycle_Count 0x0032 099 099 000 Old_age Always - 1595
194 Temperature_Celsius 0x0022 139 106 000 Old_age Always - 33
195 Hardware_ECC_Recovered 0x001a 100 100 000 Old_age Always - 684055
196 Reallocated_Event_Count 0x0032 100 100 000 Old_age Always - 0
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0030 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 3
200 Multi_Zone_Error_Rate 0x000a 100 100 051 Old_age Always - 0
201 Soft_Read_Error_Rate 0x000a 100 100 051 Old_age Always - 0
SMART Error Log Version: 1
ATA Error Count: 31 (device log contains only the most recent five errors)
CR = Command Register [HEX]
FR = Features Register [HEX]
SC = Sector Count Register [HEX]
SN = Sector Number Register [HEX]
CL = Cylinder Low Register [HEX]
CH = Cylinder High Register [HEX]
DH = Device/Head Register [HEX]
DC = Device Command Register [HEX]
ER = Error register [HEX]
ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.
Error 31 occurred at disk power-on lifetime: 3067 hours (127 days + 19 hours)
When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
04 51 00 01 4f c2 a0 Error: ABRT
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
b0 d9 00 01 4f c2 a0 00 00:04:23.750 SMART DISABLE OPERATIONS
ec 20 3f 01 00 00 a0 00 00:04:23.750 IDENTIFY DEVICE
10 20 3f 01 00 00 a0 00 00:04:23.750 RECALIBRATE [OBS-4]
91 20 3f 01 00 00 af 00 00:04:23.750 INITIALIZE DEVICE PARAMETERS [OBS-6]
ec 00 00 01 00 00 a0 00 00:04:23.750 IDENTIFY DEVICE
Error 30 occurred at disk power-on lifetime: 3067 hours (127 days + 19 hours)
When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
04 51 00 01 4f c2 a0 Error: ABRT
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
b0 d9 00 01 4f c2 a0 00 00:03:38.063 SMART DISABLE OPERATIONS
ec 20 3f 01 00 00 a0 00 00:03:38.063 IDENTIFY DEVICE
10 20 3f 01 00 00 a0 00 00:03:38.063 RECALIBRATE [OBS-4]
91 20 3f 01 00 00 af 00 00:03:38.063 INITIALIZE DEVICE PARAMETERS [OBS-6]
ec 00 00 01 00 00 a0 00 00:03:38.063 IDENTIFY DEVICE
Error 29 occurred at disk power-on lifetime: 3067 hours (127 days + 19 hours)
When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
04 51 00 01 4f c2 a0 Error: ABRT
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
b0 d9 00 01 4f c2 a0 00 00:02:59.813 SMART DISABLE OPERATIONS
ec 20 3f 01 00 00 a0 00 00:02:59.750 IDENTIFY DEVICE
10 20 3f 01 00 00 a0 00 00:02:59.750 RECALIBRATE [OBS-4]
91 20 3f 01 00 00 af 00 00:02:59.750 INITIALIZE DEVICE PARAMETERS [OBS-6]
ec 00 00 01 00 00 a0 00 00:02:59.750 IDENTIFY DEVICE
Error 28 occurred at disk power-on lifetime: 3067 hours (127 days + 19 hours)
When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
04 51 00 01 4f c2 a0 Error: ABRT
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
b0 d9 00 01 4f c2 a0 00 00:01:44.813 SMART DISABLE OPERATIONS
ec 20 3f 01 00 00 a0 00 00:01:44.813 IDENTIFY DEVICE
10 20 3f 01 00 00 a0 00 00:01:44.813 RECALIBRATE [OBS-4]
91 20 3f 01 00 00 af 00 00:01:44.813 INITIALIZE DEVICE PARAMETERS [OBS-6]
ec 00 00 01 00 00 a0 00 00:01:44.813 IDENTIFY DEVICE
Error 27 occurred at disk power-on lifetime: 3067 hours (127 days + 19 hours)
When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
04 51 00 01 4f c2 a0 Error: ABRT
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
b0 d9 00 01 4f c2 a0 00 00:00:09.375 SMART DISABLE OPERATIONS
ec 20 3f 01 00 00 a0 00 00:00:09.375 IDENTIFY DEVICE
10 20 3f 01 00 00 a0 00 00:00:09.375 RECALIBRATE [OBS-4]
91 20 3f 01 00 00 af 00 00:00:09.375 INITIALIZE DEVICE PARAMETERS [OBS-6]
ec 00 00 01 00 00 a0 00 00:00:09.375 IDENTIFY DEVICE
SMART Self-test log structure revision number 1
No self-tests have been logged. [To run self-tests, use: smartctl -t]
Device does not support Selective Self Tests/Logging
Добавлено: 19 апр 2006, 12:22
Llama
kif0rt, погоняй для начала полный SMART'овский тест, потом скачай тулзу от гнусмаса диагностическую и ей прогони. Что-то сним было, а вто что конкретно - хрен его знает, я затрудняюсь интерпретировать.
Добавлено: 19 апр 2006, 14:55
Jay
Не знаю что и делать ...
делай бэкап
Добавлено: 19 апр 2006, 20:15
Pilot
раз вытыркивание, потом втыркивание шлейфа помогло, то поменяй для начала шлейф. ещё неплохо подогнуть контакты в шлейфе питания. выключался пару раз веник именно из за него.
Добавлено: 19 апр 2006, 21:05
kif0rt
Pilot писал(а):раз вытыркивание, потом втыркивание шлейфа помогло, то поменяй для начала шлейф. ещё неплохо подогнуть контакты в шлейфе питания. выключался пару раз веник именно из за него.
Это я уже сделал. Пока глюков не замечено.
Добавлено: 19 апр 2006, 21:48
Foxx
kif0rt, кстати, надеюсь softsuspend какойнить не юзаете...
Добавлено: 19 апр 2006, 23:54
kif0rt
Foxx писал(а):kif0rt, кстати, надеюсь softsuspend какойнить не юзаете...
нет. не юзаю.