Understand S.M.A.R.T Attribute Data

disk smartmontool

I. Giới thiệu

S.M.A.R.T (Self-Monitoring, Analysis, and Reporting Technology) là công nghệ giám sát được hỗ trợ trên hầu hết thiết bị phần cứng hiện nay. Với công nghệ này, các vấn đề internal và external của ổ đĩa sẽ được giám sát lại và báo cáo lại cho người dùng tốt nhất.

II. S.M.A.R.T attributes

Mỗi thuộc tính của SMART gồm nhiều cột được mô tả trong smarctl -A <device>

ID: ID number của thuộc tính.
Name (ATTRIBUTE_NAME): Tên của thuộc tính.
Value (VALUE): Thông số hiện tại của thuộc tính. Value càng cao càng tốt hơn (ngoại trừ nhiệt độ của ổ cứng).
Worst (WORST): Thông số bad của ổ cứng, được ghi lại tại thời điểm mà smart=on.
Threshold (THRESH): Giới hạn cho phép.
Raw value (RAW_VALUE): Giá trị raw hiện tại, được chuyển đổi thành thông số Value.

III. Known ATA S.M.A.R.T. attributes

IDThuộc tính!Mô tả
01Read Error RateTỉ lệ lỗi đọc phần cứng xảy ra khi đọc dữ liệu từ bề mặt đĩa. Các giá trị khác 0 có nghĩa là có vấn đề với đĩa, đầu đọc/ghi (bao gồm cả vết nứt, đầu bị hỏng, kết nối kém với apdapter/module, ..). Giá trị Value càng cao thì khả năng hư ổ đĩa càng cao.
02Throughput PerformanceTham số cho biết hiệu suất thoughput của ổ cứng. Giá trị Value càng giảm thì khả năng cao ổ cứng gặp vấn đề càng cao.
03Spin-Up TimeThời gian trung bình (đơn vị ms hoặc s) quay của ổ đĩa (spinup) được tính từ 0 RPM đến thời thời điểm hiện tại. Raw value càng cao tương ứng với Value càng thấp thì tốc độ quay của ổ đĩa càng chậm, khả năng cao ổ đĩa đang gặp vấn đề.
04Start/Stop CountTham số Raw value cho biết số lần (chu kì) spindle (trục chính) của ổ cứng bắt đầu quay và dừng quay. Spindle được bật lên và bắt đầu quay khi ổ đĩa được bật (tương tác với nguồn điện, thao tác mở máy, ..). Mỗi ổ đĩa có giới hạn chu kì này do nhà sản xuất quy định. Value (đơn vị %) càng giảm vượt qua Threshold chứng tỏ hiệu suất của ổ cứng đang gặp vấn đề.
05Reallocated Sectors CountcriticalTham số Raw value cho biết số lượng các sectors đã được reallocated. Khi ổ cứng tìm thấy lỗi đọc/ghi (bad blocks), ổ cứng sẽ “đánh dấu” sector này là “reallocated” và chuyển dữ liệu (remapping) lên khu vực riêng biệt dự phòng (reallocated sector), tất cả bad blocks sẽ được giấu trong reallocatted sector này. Tham số Raw value càng tăng nghĩa là càng có nhiều sector được reallocated, chứng tỏ ổ cứng đang gặp vấn đề. (Tham số này ảnh hưởng đến tốc độ đọc/ghi của ổ đĩa).
Value bắt đầu từ 100 và giảm dần về 0, cho thấy tỉ lệ % còn lại của số reallocated được nhà sản xuất cho phép.
06Read Channel MarginUpdating..
07Seek Error RateRaw value cho biết số lần tìm kiếm (seek) bị lỗi của đầu từ, tham số này càng cao thì khả năng hệ thống cơ học của ổ đĩa đang gặp vấn đề.
08Seek Time PerformanceRaw value cho kết quả của phép tính tìm kiếm của đầu từ tại thời điểm nhất định. Value là hiệu suất trung bình của các phép tính tìm tiếm được tính qua các đợt ghi lại của Raw value. Value càng giảm chứng tỏ hệ thống cơ học của ổ cứng đang gặp vấn đề.
09Power-On HoursRaw value hiển thị tổng số giờ (hoặc phút, giây, tuỳ thuộc vào nhà sản xuất) ở trạng thái power-on.
Value: Luôn 100.
10Spin Retry CountcriticalRaw value cho biết số lần thử lại khi ổ đĩa cố gắng quay khi gặp lỗi nếu lần quay đầu tiên bị thất bại. Value cho biết tổng số lần ổ đĩa cố gắng quay cho đến khi đạt được tốc độ quay ổn định. Value càng tăng chứng tỏ ổ đĩa đang gặp vấn đề hoặc xuống cấp trầm trọng.
11Recalibration Retries

Calibration Retry Count
Khi khởi động máy, kết nối với nguồn điện, .. ổ đĩa sẽ tiến hành hiệu chỉnh đầu từ và các rãnh từ. Raw value cho biết số lần ổ đĩa phải hiệu chỉnh lại sau khi lần đầu không thành công tại thời điểm nhất định. Value là tổng số lần được tính từ Raw value. Value càng cao chứng tổ ổ cứng đang gặp vấn đề.
12Power Cycle CountRaw value là tổng số chu kỳ bật/tắt hoàn toàn của ổ đĩa.
Value: luôn 100.
13Soft Read Error RateTheo dõi số lỗi ECC (Error Correction Code) có thể sửa được.
22Current Helium Level(Updating …)
170Available Reserved Space(Liên quan với 5)
171SSD Program Fail Count(Kingston) (giống 181).
172SSD Erase Fail Count(Kingston) (giống 182).
173SSD Wear Leveling Count

Wear Leveling Count
Wear Leveling (độ hao mòn) được quản lý bởi flash, sử dụng thuật toán để sắp xếp các dữ liệu để các chu kỳ E/P (Erase/Program) được phân đều giữa các block. Chu kì này được ghi lại và đếm vào Raw value. Value được tính theo đơn vị %, nghĩa là nó được bắt đầu từ 100 và giảm dần về 0 mỗi khi ổ đĩa được ghi vào.
174Unexpected power loss countRaw value ghi lại số lần ổ cứng bị tắt đột ngột (như cúp điện, rút dây nguồn, …), tích luỹ suốt quá lifetime của SSD.
Value: luôn 100.
175Power Loss Protection Failure(Updating …)
176Erase Fail CountRaw value cho biết số lần flash xoá lệnh thất bại.
177Wear Range Delta
179Used Reserved Block Count Total
180Unused Reserved Block Count Total
181Program Fail Count Total

Non-4K Aligned Access Count
Raw value: cho biết tổng số lần program flash không thành công.
Value: Giảm dần từ 100 trở về 0, cho biết % số program không thành công còn lại được nhà sản xuất cho phép.
182Erase Fail CountRaw value: cho biết tổng số lần xoá flash không thành công.
Value: Giảm dần từ 100 trở về 0, cho biết % số lần xoá flash không thành công còn lại được nhà sản xuất cho phép.
183SATA Downshift Error Count

Runtime Bad Block
(WD, Samsung, Seagate)
Raw value: Thống kê số lần SATA interface bị giảm tín hiệu do gặp lỗi. Tham số này càng giảm chứng tỏ ổ đĩa đang gặp vấn đề hoặc bị xuống cấp.
Value: luôn 100.
184End-to-End error / IOEDCcriticalEnd-to-end data là các dữ liệu được chuyển từ host system (ví dụ như RAM cache) đến SSD và ngược lại.
Raw value: Thống kê số lần LBA (Logical Block Address) tag (hay parity bit) không khớp trong quá trình truyền end-to-end data.
Value: luôn 100.
185Head Stability
186Induced Op-Vibration Detection
187Reported Uncorrectable ErrorscriticalRaw value: Hiển thị số lỗi không thể khôi phục bằng ECC.
Value: luôn 100.
188Command Timeoutcritical
189High Fly Writes
190Temperature Difference

Airflow Temperature
191G-sense Error Rate
192Power-off Retract Count
Emergency Retract Cycle Count
Unsafe Shutdown Count
193Load Cycle Count
Load/Unload Cycle Count
194Temperature
Temperature Celsius
195Hardware ECC Recovered
196Reallocation Event Count*critical
197Current Pending Sector Countcritical
198(Offline) Uncorrectable Sector Count[critical
199UltraDMA CRC Error Count
200Multi-Zone Error Rate
201Soft Read Error Rate

TA Counter Detected
critical
202Data Address Mark errors

TA Counter Increased
203Run Out Cancel
204Soft ECC Correction
205Thermal Asperity Rate
206Flying Height
207Spin High Current
208Spin Buzz
209Offline Seek Performance
210Vibration During Write
211Vibration During Write
212Shock During Write
220Disk Shift
221G-Sense Error Rate
222Loaded Hours
223Load/Unload Retry Count
224Load Friction
225Load/Unload Cycle Count
226Load ‘In’-time
227Torque Amplification Count
228Power-Off Retract Cycle
230GMR Head Amplitude(HDD)

Drive Life Protection Status(SSD)
231Life Left(SSD)

Temperature
232Endurance Remaining

Available Reserved Space
233Media Wearout Indicator(SSD)

Power-On Hours
234Average erase count AND Maximum Erase Count
235Good Block Count AND System(Free) Block Count
240Head Flying Hours

Transfer Error Rate
241Total LBAs Written
242Total LBAs Read
243Total LBAs Written Expanded
244Total LBAs Read Expanded
249NAND Writes (1GiB)
250Read Error Retry Rate
251Minimum Spares Remaining
252Newly Added Bad Flash Block
254Free Fall Protection