<div dir='auto'>Hi Melissa,<div dir="auto"><br></div><div dir="auto">That makes sense. Thanks for clarifying.</div><div dir="auto"><br></div><div dir="auto">Kind regards,</div><div dir="auto">Dylan Hicks [333]</div></div><div class="gmail_extra"><br><div class="gmail_quote">On 19 Mar 2019 12:14 pm, Melissa Star &lt;melissa@netexperts.com.au&gt; wrote:<br type="attribution" /><blockquote class="quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div style="word-wrap:break-word">Hi Dylan,<div><br /></div><div>It depends on:</div><div><br /></div><div>* Whether the sector failure rate is increasing, particularly if the increase is marked (that indicates a drive near end of life).</div><div><br /></div><div>* How critical the data on the drive is. </div><div><br /></div><div>Generally, once sectors start to fail, all of the memory on the drive will have aged to the point that more and more will fail over time. The drive is certainly still usable for non-critical applications on a desktop machine on data that isn&#39;t financial, health related, or otherwise mission critical (meaning changes to the data will either get you sued for millions of dollars or endanger human life).</div><div><br /></div><div>The expectation is a server SSD, that may be storing financial or critical data, should look like this:</div><div><br /></div><div><div style="margin:0px;font-stretch:normal;font-size:14px;line-height:normal;font-family:&#39;menlo&#39;;color:rgb( 242 , 242 , 242 );background-color:rgb( 0 , 0 , 0 )">  5 Reallocated_Sector_Ct   0x0032   100   100   000    Old_age   Always       -       0</div><div style="margin:0px;font-stretch:normal;font-size:14px;line-height:normal;font-family:&#39;menlo&#39;;color:rgb( 242 , 242 , 242 );background-color:rgb( 0 , 0 , 0 )">  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       15708</div></div><div><br /></div><div><div style="margin:0px;font-stretch:normal;font-size:14px;line-height:normal;font-family:&#39;menlo&#39;;color:rgb( 242 , 242 , 242 );background-color:rgb( 0 , 0 , 0 )">  5 Reallocated_Sector_Ct   0x0032   100   100   000    Old_age   Always       -       0</div><div style="margin:0px;font-stretch:normal;font-size:14px;line-height:normal;font-family:&#39;menlo&#39;;color:rgb( 242 , 242 , 242 );background-color:rgb( 0 , 0 , 0 )">  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       15708</div></div><div style="margin:0px;font-stretch:normal;font-size:14px;line-height:normal;font-family:&#39;menlo&#39;;color:rgb( 242 , 242 , 242 );background-color:rgb( 0 , 0 , 0 )"><br /></div><div><br /></div><div><br /></div><div>That data is from two mirrored SSDs on Nyx, one of my production servers. Drives have been running for a total of 15,700 hours or two year at 24/7/365</div><div><br /></div><div>If that number changes from zero, I will require OVH to replace the drive in question, and have a 3AM scheduled outage while the array rebuilds.</div><div><br /></div><div>And from my 7 year old, 2012 Macbook Pro</div><div><br /></div><div><div style="margin:0px;font-stretch:normal;font-size:14px;line-height:normal;font-family:&#39;menlo&#39;;color:rgb( 242 , 242 , 242 );background-color:rgb( 0 , 0 , 0 )"> 5 Reallocated_Sector_Ct   0x0033   100   100   000    Pre-fail  Always       -       0</div><div style="margin:0px;font-stretch:normal;font-size:14px;line-height:normal;font-family:&#39;menlo&#39;;color:rgb( 242 , 242 , 242 );background-color:rgb( 0 , 0 , 0 )">  9 Power_On_Hours          0x0032   096   096   000    Old_age   Always       -       18196</div></div><div><br /></div><div>In spite of </div><div><br /></div><div><div style="margin:0px;font-stretch:normal;font-size:14px;line-height:normal;font-family:&#39;menlo&#39;;color:rgb( 242 , 242 , 242 );background-color:rgb( 0 , 0 , 0 )">173 Wear_Leveling_Count     0x0032   191   191   100    Old_age   Always       -       304961552547</div></div><div><div><br /></div><div>If you have a gaming PC, and you keep daily backups of your uni work, you definitely can keep using an SSD once it starts showing wear, although I&#39;d begin to budget for its replacement, and there may be an argument for selling it on Ebay (with a warning about its reallocated sectors, if you are honest).</div><div><br /></div><div>If it&#39;s as UCC, then... I wouldn&#39;t allow it on Ashera, but the rest of the machines are up to Wheel discretion.</div><div><br /></div><div>If anyone&#39;s life, or livelihood depends on data not being corrupted, please Goddess no. Where the data on the drive is work 100x  or more what the drive is worth, you don&#39;t want such scenarios.</div><div><br /></div><div>Regards,</div><div><br /></div><div>Melissa</div><div><br /></div><div><br /></div><div><blockquote><div>On 18 Mar 2019, at 4:59 pm, Dylan H &lt;<a href="mailto:dylanh333&#64;ucc.asn.au">dylanh333&#64;ucc.asn.au</a>&gt; wrote:</div><br /><div><div dir="auto">Hi Melissa,<div dir="auto"><br /></div><div dir="auto">Can you please clarify whether it really is an issue to have any reallocated sectors at all on an SSD, even if only very few?</div><div dir="auto"><br /></div><div dir="auto">My understanding is that the Raw Value is the actual number of sectors reallocated, and the Value is the normalised value, which should not reach the threshold (lower is worse, so a Value of 98 is better than 20).</div><div dir="auto">Assuming this, I don&#39;t imagine a small handful of reallocated sectors is much of an issue, unless the normalised value is getting close to the threshold (0 in this case), as most SSDs come with a sizeable chunk of spare, hidden sectors to swap in, as far as I am aware.</div><div dir="auto"><br /></div><div dir="auto">My main concern is that replacing an SSD that only has a small handful of reallocated sectors but a normalised value of 90&#43; (for example) would be a bit wasteful, when it still has 90% to go before reaching the vendor-defined threshold.</div><div dir="auto"><br /></div><div dir="auto">Thanks! </div><div dir="auto"><br /></div><div dir="auto">Kind regards,</div><div dir="auto">Dylan Hicks [333]</div><br /><div dir="auto"><br /><div class="elided-text">On 18 Mar 2019 3:13 pm, Melissa Star &lt;<a href="mailto:melissa&#64;netexperts.com.au">melissa&#64;netexperts.com.au</a>&gt; wrote:<br type="attribution" /><blockquote style="margin:0 0 0 0.8ex;border-left:1px #ccc solid;padding-left:1ex"><div style="word-wrap:break-word">Hi Everyone,<div><br /></div><div>I just realised - if you have smartmontools installed on linux machines, each hard drive or SSD will provide its “Airflow Temperature”, which I can extract via script.</div><div><br /></div><div>I&#39;m thinking of centralising this for all the servers I run, and collecting the data to chart, having a display at home that gives me live info for all machines under my control.</div><div><br /></div><div>I could make a similar display for UCC, which could be on the website and/or a monitor in the club room (although this would likely be in the winter holidays due to increasing workload).</div><div><br /></div><div>Note the <b>reallocated sector count </b>for SSDs, once this starts to happen, the drive should be replaced. </div><div><br /></div><div>For SSDs (and also HDDs) mounted at the front of servers, because they are getting airflow to the sensor sucked in directly from ambient air, and are thermally insulated from the rest of the machine, this will <b>be equal to the temperature of the room</b>.</div><div><br /></div><div>For example, right now, the UCC server room temperature is <b>29 degrees, </b>according to 3 of the four installed drives, and <b>30 degrees</b> according to the 4th one.</div><div><br /></div><div>For PCs, the same test will provide the temperature in the case. Some drives also have a count of total hours run outside of their acceptable temperature range and G/shocks or drops, as well as all types of other interesting data.</div><div><br /></div><div>If there is an interest, I could parse this data, and the page with Ashera-related information could provide it and could also e-mail (and/or SMS) warnings to anyone on the list if the temperature passes a key threshold.</div><div><br /></div><div>Here is what the data actually looks like (I&#39;ve highlighted the airflow temperature):</div><div><br /></div><div><div style="margin:0px;font-stretch:normal;font-size:14px;line-height:normal;font-family:&#39;menlo&#39;;color:rgb( 242 , 242 , 242 );background-color:rgb( 0 , 0 , 0 )">smartctl -d sat -a /dev/pass1</div><div style="margin:0px;font-stretch:normal;font-size:14px;line-height:normal;font-family:&#39;menlo&#39;;color:rgb( 242 , 242 , 242 );background-color:rgb( 0 , 0 , 0 )">smartctl 7.0 2018-12-30 r4883 [FreeBSD 12.0-STABLE amd64] (local build)</div><div style="margin:0px;font-stretch:normal;font-size:14px;line-height:normal;font-family:&#39;menlo&#39;;color:rgb( 242 , 242 , 242 );background-color:rgb( 0 , 0 , 0 )">Copyright (C) 2002-18, Bruce Allen, Christian Franke, <a href="http://www.smartmontools.org/">www.smartmontools.org</a></div><div style="margin:0px;font-stretch:normal;font-size:14px;line-height:normal;font-family:&#39;menlo&#39;;color:rgb( 242 , 242 , 242 );background-color:rgb( 0 , 0 , 0 );min-height:16px"><br /></div><div style="margin:0px;font-stretch:normal;font-size:14px;line-height:normal;font-family:&#39;menlo&#39;;color:rgb( 242 , 242 , 242 );background-color:rgb( 0 , 0 , 0 )">&#61;&#61;&#61; START OF INFORMATION SECTION &#61;&#61;&#61;</div><div style="margin:0px;font-stretch:normal;font-size:14px;line-height:normal;font-family:&#39;menlo&#39;;color:rgb( 242 , 242 , 242 );background-color:rgb( 0 , 0 , 0 )">Device Model:     Samsung SSD 860 QVO 1TB</div><div style="margin:0px;font-stretch:normal;font-size:14px;line-height:normal;font-family:&#39;menlo&#39;;color:rgb( 242 , 242 , 242 );background-color:rgb( 0 , 0 , 0 )">Serial Number:    S4CZNG0M138175F</div><div style="margin:0px;font-stretch:normal;font-size:14px;line-height:normal;font-family:&#39;menlo&#39;;color:rgb( 242 , 242 , 242 );background-color:rgb( 0 , 0 , 0 )">LU WWN Device Id: 5 002538 e701b1df5</div><div style="margin:0px;font-stretch:normal;font-size:14px;line-height:normal;font-family:&#39;menlo&#39;;color:rgb( 242 , 242 , 242 );background-color:rgb( 0 , 0 , 0 )">Firmware Version: RVQ01B6Q</div><div style="margin:0px;font-stretch:normal;font-size:14px;line-height:normal;font-family:&#39;menlo&#39;;color:rgb( 242 , 242 , 242 );background-color:rgb( 0 , 0 , 0 )">User Capacity:    1,000,204,886,016 bytes [1.00 TB]</div><div style="margin:0px;font-stretch:normal;font-size:14px;line-height:normal;font-family:&#39;menlo&#39;;color:rgb( 242 , 242 , 242 );background-color:rgb( 0 , 0 , 0 )">Sector Size:      512 bytes logical/physical</div><div style="margin:0px;font-stretch:normal;font-size:14px;line-height:normal;font-family:&#39;menlo&#39;;color:rgb( 242 , 242 , 242 );background-color:rgb( 0 , 0 , 0 )">Rotation Rate:    Solid State Device</div><div style="margin:0px;font-stretch:normal;font-size:14px;line-height:normal;font-family:&#39;menlo&#39;;color:rgb( 242 , 242 , 242 );background-color:rgb( 0 , 0 , 0 )">Form Factor:      2.5 inches</div><div style="margin:0px;font-stretch:normal;font-size:14px;line-height:normal;font-family:&#39;menlo&#39;;color:rgb( 242 , 242 , 242 );background-color:rgb( 0 , 0 , 0 )">Device is:        Not in smartctl database [for details use: -P showall]</div><div style="margin:0px;font-stretch:normal;font-size:14px;line-height:normal;font-family:&#39;menlo&#39;;color:rgb( 242 , 242 , 242 );background-color:rgb( 0 , 0 , 0 )">ATA Version is:   ACS-4 T13/BSR INCITS 529 revision 5</div><div style="margin:0px;font-stretch:normal;font-size:14px;line-height:normal;font-family:&#39;menlo&#39;;color:rgb( 242 , 242 , 242 );background-color:rgb( 0 , 0 , 0 )">SATA Version is:  SATA 3.2, 6.0 Gb/s (current: 6.0 Gb/s)</div><div style="margin:0px;font-stretch:normal;font-size:14px;line-height:normal;font-family:&#39;menlo&#39;;color:rgb( 242 , 242 , 242 );background-color:rgb( 0 , 0 , 0 )">Local Time is:    Mon Mar 18 15:03:46 2019 AWST</div><div style="margin:0px;font-stretch:normal;font-size:14px;line-height:normal;font-family:&#39;menlo&#39;;color:rgb( 242 , 242 , 242 );background-color:rgb( 0 , 0 , 0 )">SMART support is: Available - device has SMART capability.</div><div style="margin:0px;font-stretch:normal;font-size:14px;line-height:normal;font-family:&#39;menlo&#39;;color:rgb( 242 , 242 , 242 );background-color:rgb( 0 , 0 , 0 )">SMART support is: Enabled</div></div><div>... (cut to prevent this email becoming ridiculous) ...</div><div><br /></div><div><div style="margin:0px;font-stretch:normal;font-size:14px;line-height:normal;font-family:&#39;menlo&#39;;color:rgb( 242 , 242 , 242 );background-color:rgb( 0 , 0 , 0 )">SMART Attributes Data Structure revision number: 1</div><div style="margin:0px;font-stretch:normal;font-size:14px;line-height:normal;font-family:&#39;menlo&#39;;color:rgb( 242 , 242 , 242 );background-color:rgb( 0 , 0 , 0 )">Vendor Specific SMART Attributes with Thresholds:</div><div style="margin:0px;font-stretch:normal;font-size:14px;line-height:normal;font-family:&#39;menlo&#39;;color:rgb( 242 , 242 , 242 );background-color:rgb( 0 , 0 , 0 )">ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE</div><div style="margin:0px;font-stretch:normal;font-size:14px;line-height:normal;font-family:&#39;menlo&#39;;color:rgb( 242 , 242 , 242 );background-color:rgb( 0 , 0 , 0 )">  5 Reallocated_Sector_Ct   0x0033   100   100   010    Pre-fail  Always       -       0</div><div style="margin:0px;font-stretch:normal;font-size:14px;line-height:normal;font-family:&#39;menlo&#39;;color:rgb( 242 , 242 , 242 );background-color:rgb( 0 , 0 , 0 )">  9 Power_On_Hours          0x0032   099   099   000    Old_age   Always       -       648</div><div style="margin:0px;font-stretch:normal;font-size:14px;line-height:normal;font-family:&#39;menlo&#39;;color:rgb( 242 , 242 , 242 );background-color:rgb( 0 , 0 , 0 )"> 12 Power_Cycle_Count       0x0032   099   099   000    Old_age   Always       -       15</div><div style="margin:0px;font-stretch:normal;font-size:14px;line-height:normal;font-family:&#39;menlo&#39;;color:rgb( 242 , 242 , 242 );background-color:rgb( 0 , 0 , 0 )">177 Wear_Leveling_Count     0x0013   100   100   000    Pre-fail  Always       -       0</div><div style="margin:0px;font-stretch:normal;font-size:14px;line-height:normal;font-family:&#39;menlo&#39;;color:rgb( 242 , 242 , 242 );background-color:rgb( 0 , 0 , 0 )">179 Used_Rsvd_Blk_Cnt_Tot   0x0013   100   100   010    Pre-fail  Always       -       0</div><div style="margin:0px;font-stretch:normal;font-size:14px;line-height:normal;font-family:&#39;menlo&#39;;color:rgb( 242 , 242 , 242 );background-color:rgb( 0 , 0 , 0 )">181 Program_Fail_Cnt_Total  0x0032   100   100   010    Old_age   Always       -       0</div><div style="margin:0px;font-stretch:normal;font-size:14px;line-height:normal;font-family:&#39;menlo&#39;;color:rgb( 242 , 242 , 242 );background-color:rgb( 0 , 0 , 0 )">182 Erase_Fail_Count_Total  0x0032   100   100   010    Old_age   Always       -       0</div><div style="margin:0px;font-stretch:normal;font-size:14px;line-height:normal;font-family:&#39;menlo&#39;;color:rgb( 242 , 242 , 242 );background-color:rgb( 0 , 0 , 0 )">183 Runtime_Bad_Block       0x0013   100   100   010    Pre-fail  Always       -       0</div><div style="margin:0px;font-stretch:normal;font-size:14px;line-height:normal;font-family:&#39;menlo&#39;;color:rgb( 242 , 242 , 242 );background-color:rgb( 0 , 0 , 0 )">187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0</div><div style="margin:0px;font-stretch:normal;font-size:14px;line-height:normal;font-family:&#39;menlo&#39;"><span style="background-color:rgb( 255 , 255 , 2 )"><font color="#fefefe">190 Airflow_Temperature_Cel 0x0032   071   058   000    Old_age   Always       -       29</font></span></div><div style="margin:0px;font-stretch:normal;font-size:14px;line-height:normal;font-family:&#39;menlo&#39;;color:rgb( 242 , 242 , 242 );background-color:rgb( 0 , 0 , 0 )">195 Hardware_ECC_Recovered  0x001a   200   200   000    Old_age   Always       -       0</div><div style="margin:0px;font-stretch:normal;font-size:14px;line-height:normal;font-family:&#39;menlo&#39;;color:rgb( 242 , 242 , 242 );background-color:rgb( 0 , 0 , 0 )">199 UDMA_CRC_Error_Count    0x003e   100   100   000    Old_age   Always       -       0</div><div style="margin:0px;font-stretch:normal;font-size:14px;line-height:normal;font-family:&#39;menlo&#39;;color:rgb( 242 , 242 , 242 );background-color:rgb( 0 , 0 , 0 )">235 Unknown_Attribute       0x0012   099   099   000    Old_age   Always       -       13</div><div style="margin:0px;font-stretch:normal;font-size:14px;line-height:normal;font-family:&#39;menlo&#39;;color:rgb( 242 , 242 , 242 );background-color:rgb( 0 , 0 , 0 )">241 Total_LBAs_Written      0x0032   099   099   000    Old_age   Always       -       336661820</div><div style="margin:0px;font-stretch:normal;font-size:14px;line-height:normal;font-family:&#39;menlo&#39;;color:rgb( 242 , 242 , 242 );background-color:rgb( 0 , 0 , 0 );min-height:16px"><br /></div><div style="margin:0px;font-stretch:normal;font-size:14px;line-height:normal;font-family:&#39;menlo&#39;;color:rgb( 242 , 242 , 242 );background-color:rgb( 0 , 0 , 0 )">SMART Error Log Version: 1</div><div style="margin:0px;font-stretch:normal;font-size:14px;line-height:normal;font-family:&#39;menlo&#39;;color:rgb( 242 , 242 , 242 );background-color:rgb( 0 , 0 , 0 )">No Errors Logged</div><div><br /></div><div><br /></div><div><br /></div><div><br /></div></div><div><br /></div><div><br /></div><div>Regards,</div><div><br /></div><div>Melissa</div></div></blockquote></div><br /></div></div></div></blockquote></div><br /></div></div></blockquote></div><br></div>