การใช้ระยะทางทางสถิติสำหรับการตรวจสอบเครือข่ายเซ็นเซอร์แบบเรียลไทม์
Using Statistical Distances for Real-time Sensor Networks Validation

Posted on April 28th 2020
แบ่งปัน: aqicn.org/faq/using-statistical-distances-for-real-time-sensor-networks-validation/th/
Overlapping kernel densities,
(credits)

ย้อนกลับไปในปี 2008 เมื่อโครงการคุณภาพอากาศโลกเริ่มต้นขึ้น สถานีตรวจสอบคุณภาพอากาศที่มีอยู่ทั้งหมดซึ่งใช้เทคโนโลยี BAM และ TOEM ที่มีความเป็นมืออาชีพสูงและมีราคาแพง สถานีประเภทนี้ได้รับการดูแลโดยผู้ปฏิบัติงานมืออาชีพและมีคุณสมบัติสูงอยู่เสมอ และช่วยให้มั่นใจได้ว่าเอาต์พุตของสถานีนี้จะเชื่อถือได้

12 ปีต่อมา สถานี BAM และ TOEM ยังคงมีอยู่ แต่ด้วยการพัฒนาเทคโนโลยีการกระเจิงด้วยเลเซอร์และเซ็นเซอร์ฝุ่นราคาประหยัด ปัจจุบันสถานี BAM และ TOEM มีจำนวนมากกว่าเครือข่ายเซ็นเซอร์ต้นทุนต่ำที่ใหญ่โตและหนาแน่น ปัจจุบันมีเครือข่ายเหล่านั้นอยู่มากมาย เช่น urad, luft-daten, airqo, airbg, opensense, yakkaw, econet, airkaz, ccdc, ambente, green air ฯลฯ

ปัญหาพื้นฐานประการหนึ่งของเครือข่ายเซ็นเซอร์ราคาประหยัดคือความน่าเชื่อถือ: เนื่องจากเซ็นเซอร์จำนวนมากไม่ได้รับการบำรุงรักษาอย่างเหมาะสม (หรือไม่ได้รับการบำรุงรักษาเลย) ปริมาณของเซ็นเซอร์ที่สร้างการวัดที่ผิดพลาดโดยสิ้นเชิงจึงไม่ใช่เรื่องเล็กน้อย นอกจากนี้ เครือข่ายส่วนใหญ่ไม่ใช้สถานีที่มีเซ็นเซอร์จำลอง (ต่างจากสถานี Gaia ของเราซึ่งใช้เซ็นเซอร์จำลอง 3 ตัว) ทำให้ยากยิ่งขึ้นที่จะทราบเมื่อเซ็นเซอร์ตัวเดียวทำงานล้มเหลว

ในบทความนี้ เราจะดูที่เครือข่ายเซ็นเซอร์ที่ใช้งานในเมืองโวลอสในกรีซที่สวยงามที่ไหน และการศึกษาหมายถึงคุณสมบัติและปริมาณความน่าเชื่อถือของสถานีแบบเรียลไทม์


--

เมืองโวลอสที่สวยงามในกรีซ

โวลอส (กรีก: Βόλος) เป็นเมืองท่าชายฝั่งทะเล ด้วยจำนวนประชากร 144,449 คน (พ.ศ. 2554) และยังเป็นเมืองที่มีประชากรมากที่สุดอันดับที่ 6 ของกรีซอีกด้วย ที่นี่เป็นศูนย์กลางอุตสาหกรรมที่สำคัญ ในขณะที่ท่าเรือก็เป็นสะพานเชื่อมระหว่างยุโรปและเอเชีย ขณะนี้มี 5 สถานีในโวลอส: หนึ่งสถานีจาก Greek EPA ที่ให้ข้อมูลรายชั่วโมงจากสถานี BAM มืออาชีพ และสถานีเรียลไทม์ราคาประหยัด 4 สถานีจากเครือข่าย lutf-daten :



สถานี Volos EPA ตั้งอยู่ที่อาคารของ ฝ่ายบริหารแบบกระจายอำนาจในเมืองเทสซาลีและกรีซตอนกลาง สถานีอื่นๆ ทั้งหมดยังตั้งอยู่ในเขตที่อยู่อาศัย ยกเว้นสถานี Argonafton ซึ่งตั้งอยู่ติดกับท่าเรือ

การจราจรในท่าเรือนั้นไม่สำคัญ โดยมี เรือเข้า / ออกโดยเฉลี่ยประมาณ 8 ลำต่อวัน โดย 80% ของเรือเป็นสินค้า - ในขณะที่เขียน

ปัญหาหนึ่งที่ทราบเกี่ยวกับสินค้าอาจเป็นมลพิษจากอนุภาคจากท่อไอเสียเนื่องจาก น้ำมันเชื้อเพลิงคุณภาพต่ำ แต่เมื่อมอง ภาพพาโนรา มาจากที่ตั้งของสถานี Argonafton ระยะทางถึงสินค้าก็ไกลพอที่จะไม่พิสูจน์แหล่งกำเนิดมลพิษทางอากาศที่คงที่ เราอาจจะได้เห็นสักครั้งหนึ่งเมื่ออากาศในเมืองอาร์โกนาฟตันมีมลพิษมากขึ้น โดยเฉพาะอย่างยิ่งเมื่อมีเรือขนาดใหญ่แล่นหลบเลี่ยง แต่ไม่ใช่ตลอดเวลา ท้ายที่สุดแล้ว มีเพียง 8 ลำเท่านั้นที่แล่นในแต่ละวัน


A view of the waterfrond of the town of Volos, Greece
(attribution: wikipedia)


--

ข้อมูลอนุกรมเวลา 30 วันที่ผ่านมา

จากข้อมูลที่ตั้งของสถานี เราสามารถคาดหวังได้ว่าทุกสถานีเห็นด้วยกับระดับมลพิษทางอากาศที่ใกล้เคียงกัน ยกเว้นเหตุการณ์มลพิษที่สูงขึ้นประปรายสำหรับ Argonafton แต่น่าเสียดายที่นี่ไม่ใช่กรณีจริงๆ ดังที่ได้รับการยืนยันจากกราฟลำดับเวลาด้านล่าง:

โครงเรื่องอนุกรมเวลาแสดงให้เห็นอย่างชัดเจนว่าข้อมูลของ Argonafton ดูเหมือนเกินประมาณการเมื่อเปรียบเทียบกับสถานีอื่นๆ ในทำนองเดียวกัน ข้อมูลของ Dimarxou ดูเหมือนจะต่ำกว่าที่ประมาณการไว้

วิธีที่ดีกว่าในการเน้นประเด็นนี้คือการแสดงภาพเปอร์เซ็นไทล์ AQI ที่ 75 รายวัน โดยลงจุดโดยใช้ช่วงสี AQI ที่สอดคล้องกัน การเบี่ยงเบนจาก Argonafton นั้นชัดเจน ยิ่งไปกว่านั้น ยังเป็นไปได้ที่จะแยกความแตกต่างระหว่างสองกลุ่มที่มีศูนย์กลางอยู่ที่ริกา-เฟไรอู+กัสทานาอิส และโวลอส EPA+ดิมาร์ซู


--

การหาปริมาณความแตกต่างของอนุกรมเวลา

เมื่อพูดถึงการเปรียบเทียบอนุกรมเวลาที่สัมพันธ์กัน วิธีที่ดีที่สุดคือการเปรียบเทียบการแจกแจงความน่าจะเป็น กราฟ 3 กราฟด้านล่างนี้แสดงถึงการกระจายความหนาแน่น, CDF (ฟังก์ชันการกระจายสะสม) และ QQ (โดยใช้ Volos EPA เป็น CDF อ้างอิง) กราฟทั้ง 3 กราฟนี้อิงตามข้อมูลอนุกรมเวลา 30 วันที่ผ่านมา แต่คุณสามารถเลือกช่วงเวลาที่ต้องการในกราฟอนุกรมเวลาแรกได้ และกราฟทั้ง 3 กราฟดังกล่าวจะได้รับการอัปเดตโดยใช้ค่าจากช่วงเวลาที่กำหนด

เมื่อพิจารณาการแจกแจงความน่าจะเป็นด้วยตาเปล่า เห็นได้ชัดว่ามีความแตกต่างอย่างมากระหว่าง Argonafton, Dimarxou และสถานี Volos EPA อ้างอิง เป็นที่น่าสังเกตว่ามี "การชน" อยู่รอบๆ AQI 150: เหตุผลก็คือ แผนการกระจายจะขึ้นอยู่กับ AQI มากกว่าความเข้มข้นดิบ และช่วง AQI ที่กะทัดรัดกว่า [150,200] (เทียบกับ [100,150]) ทำให้ AQI หนาแน่นกว่าสำหรับ >150 เทียบกับ <150

เมื่อพูดถึงการหาปริมาณความแตกต่างนี้ คุณสามารถใช้แนวคิดเรื่องระยะทางทางสถิติเพื่อหาปริมาณ "ความดีของความพอดี" ได้ ระยะทางที่รู้จักกันดีที่สุดคือระยะทางโคลโมโกรอฟ-สมีร์นอฟ วัสเซอร์สไตน์ และคราเมร์-วอน มิเซส (สำหรับคำแนะนำที่ดีเกี่ยวกับระยะทางเหล่านั้น โปรดดู คำอธิบาย ที่ดีเยี่ยมนี้) ตารางด้านล่างแสดงระยะทางตามข้อมูล 30 วัน (ค่าจะได้รับการอัปเดตหากคุณเลือกช่วงเวลาจากกราฟอนุกรมเวลาหลัก)

Station
Kolmogorov-Smirnov
Wasserstein
Cramér-von Mises

แม้ว่าระยะทางโคลโมโกรอฟ-สมีร์นอฟไม่สามารถจับระยะทางสัมพัทธ์ได้อย่างถูกต้อง (โดยเน้นที่ดิมาร์ซูถึงอาร์โกนาฟตัน) ทั้งระยะทางวัสเซอร์สไตน์และคราเมร์-ฟอน มิเซสจะเน้นระยะทางที่ใหญ่กว่าอย่างเห็นได้ชัดสำหรับอาร์โกนาฟตอน ค่าในตารางด้านบนอิงตามข้อมูลในช่วง 30 วัน กราฟ 3 รายการด้านล่างนี้อิงตามค่าเฉลี่ยเคลื่อนที่ 7 วันในช่วง 30 วันที่ผ่านมา

กราฟเหล่านั้นยืนยันว่าการใช้ระยะทาง Wasserstein หรือ Cramér-von ระยะทางจากสถานี Argonafton และ Volos EPA นั้นมากกว่าระยะทางของสถานีอื่นๆ อย่างน้อยสองเท่าอย่างต่อเนื่อง

การเชื่อมโยงข้อมูลอุตุนิยมวิทยา

เพื่อยืนยันสมมติฐานที่ว่าสถานี Argonafton กำลังอ่านค่าความเข้มข้นที่ผิดปกติและประมาณการไว้สูงเกินไป เราต้องดูข้อมูลอุตุนิยมวิทยา: สภาพที่สถานี Argonafton สามารถมองเห็นความเข้มข้นที่สูงขึ้นคือเมื่อลมพัดมาจากทางใต้ กล่าวคือลมพัดพาท่อไอเสียของสินค้าไปยังสถานี

ขั้นตอนแรกคือการตรวจสอบทิศทางและความเร็วลมเฉลี่ยในช่วง 30 วันที่ผ่านมา ข้อมูลลมได้มาจากทั้งสถานี METAR สนามบิน โวลอส และสถานีตรวจอากาศ Netatmo Tthiseos กุหลาบลม 2 ดอก หมายถึง จำนวนครั้งที่ลมพัดในแต่ละทิศทาง

แปลงกุหลาบลมทั้งสองแปลงแสดงว่าลมพัดมาจากตะวันตกหรือตะวันออกเป็นหลัก และพัดมาจากทิศใต้น้อยกว่ามาก เนื่องจากมีภูเขาทางตอนเหนือของโวลอส จึงไม่มีลมพัดมาจากทางเหนือด้านล่าง

จากการยืนยันเชิงประจักษ์นี้ว่าลมพัดจากทิศใต้น้อยกว่าทิศทางอื่น จึงไม่สามารถสรุปได้ว่าท่อไอเสียของสินค้าเป็นสาเหตุที่ทำให้ความเข้มข้นของ PM 2.5 สูงขึ้นสำหรับสถานี Argonafton สมมติฐานนี้ยังไม่เป็นโมฆะด้วยแผนภาพความสัมพันธ์ระหว่าง 3 สถานีกับทิศทางลมของสนามบิน ซึ่งแสดงให้เห็นว่าไม่มีหลักฐานที่ชัดเจน (สำหรับสถานีใด ๆ ) ว่าลมทางใต้บ่งบอกถึงความเข้มข้นสูง

สุดท้ายนี้ เราต้องตรวจสอบด้วยว่าปัญหาของ Argonafton อาจเกี่ยวข้องกับความชื้นสัมพัทธ์หรือไม่ ตัวอย่างเช่น ปัญหาอาจเกิดจากความชื้นที่สูงขึ้นทำให้ขนาดอนุภาคใหญ่ขึ้น และส่งผลให้มีความเข้มข้นสูงขึ้น แผนภาพความสัมพันธ์ด้านล่างนี้ยืนยันว่าสิ่งนี้ไม่ถูกต้อง เนื่องจากไม่มีหลักฐานที่ชัดเจนว่าความเข้มข้นเป็นสัดส่วนกับความชื้น

บทสรุป

ในบทความนี้ เราได้พิจารณาวิธีการวัดปริมาณและรับรองคุณภาพข้อมูลสำหรับสถานีแบบเรียลไทม์ สมมติว่ามีสถานีอ้างอิงที่เชื่อถือได้ เราได้แสดงให้เห็นว่าการหาปริมาณโดยใช้ระยะทาง Cramér-von Mises หรือ Wasserstein สามารถบ่งบอกถึงปัญหากับข้อมูลสถานีใดๆ ได้

เรายังแสดงให้เห็นด้วยว่าระยะทางในตัวมันเองนั้นไม่เพียงพอ และเพื่อให้แม่นยำยิ่งขึ้น ควรเข้าใจบริบทของสถานี เช่นตำแหน่งและสภาพอุตุนิยมวิทยา อย่างไรก็ตาม เนื่องจากบริบทไม่ใช่สิ่งที่สามารถทำให้เป็นอัตโนมัติได้ วิธีแก้ปัญหาขั้นสุดท้ายที่ใช้สำหรับโครงการ WAQI จึงประกอบด้วยสถานีที่มีคุณสมบัติซึ่งระยะทางทางสถิติไปยังสถานีอ้างอิงน้อยกว่า 1/4 การดำเนินการนี้จะมีผลบังคับใช้ในอีกไม่กี่สัปดาห์ข้างหน้า (ดู aqicn.org/station/ สำหรับแผนที่สถานีแบบเรียลไทม์

บทความนี้เป็นส่วนหนึ่งของบทความชุดนี้ และในบทความถัดไป เราจะดูวิธีการของสถานีที่มีคุณสมบัติตามที่กำหนดซึ่งไม่มีสถานีอ้างอิงที่มีอยู่


--

Volos promenade by night
คลิกที่นี่เพื่อดูรายการคำถามที่พบบ่อยทั้งหมด
  • AQI Scale: What do the colors and numbers mean?
  • Using Statistical Distances for Real-time Sensor Networks Validation
  • Nitrogen Dioxyde (NO2) in our atmosphere
  • เกี่ยวกับการตรวจวัดคุณภาพอากาศและมลพิษ:

    เกี่ยวกับระดับคุณภาพอากาศ

    -ค่าดัชนีคุณภาพอากาศ (AQI)ระดับความกังวลเรื่องสุขภาพ
    0 - 50ดีคุณภาพอากาศถือว่าเป็นที่น่าพอใจและมลพิษทางอากาศทำให้เกิดความเสี่ยงเพียงเล็กน้อยหรือไม่มีเลย
    51 -100ปานกลางคุณภาพอากาศเป็นที่ยอมรับได้ อย่างไรก็ตามสำหรับสารมลพิษบางอย่างอาจต้องระวังในกลุ่มผู้ที่แพ้ฝุ่นละอองและสารเคมีได้ง่าย
    101-150ไม่ดีต่อสุขภาพ สำหรับ กลุ่มที่ไวต่อมลพิษทางอากาศ หรือกลุ่มที่แพ้อากาศง่ายอาจมีผลกระทบต่อสุขภาพของประชาชนกลุ่มเสี่ยง ส่วนประชาชนทั่วไปอาจไม่ได้รับผลกระทบ
    151-200มีผลกระทบต่อสุขภาพเราทุกคนอาจเริ่มรู้สึกถึงผลกระทบต่อสุขภาพ กลุ่มคนที่มีความเสี่ยงสูงอาจได้รับผลกระทบด้านสุขภาพที่รุนแรงขึ้น
    201-300อันตรายต่อสุขภาพเป็นอย่างมากคำเตือนด้านสุขภาพในภาวะฉุกเฉิน ประชากรทั้งหมดมีแนวโน้มที่จะได้รับผลกระทบมากขึ้น
    300+เสี่ยงอันตรายการแจ้งเตือนด้านสุขภาพ: ทุกคนอาจได้รับผลกระทบด้านสุขภาพที่รุนแรงขึ้น

    หากต้องการทราบข้อมูลเพิ่มเติมเกี่ยวกับคุณภาพอากาศและมลพิษ โปรดดู หัวข้อคุณภาพอากาศในวิกิพีเดีย หรือ คู่มือ airnow เกี่ยวกับคุณภาพอากาศและสุขภาพของคุณ

    หากต้องการคำแนะนำด้านสุขภาพที่เป็นประโยชน์มากของแพทย์ปักกิ่ง Richard Saint Cyr MD โปรดดูบล็อกที่ www.myhealthbeijing.com


    ประกาศเกี่ยวกับการใช้งาน: ข้อมูลคุณภาพอากาศทั้งหมดอาจจะยังไม่ได้รับการตรวจสอบในขณะที่มีการเผยแพร่และเนื่องจากการตรวจสอบข้อมูลเหล่านี้อาจได้รับการแก้ไขโดยไม่ต้องแจ้งให้ทราบได้ตลอดเวลา โครงการ World Air Quality Index ได้ระมัดระวังเรื่องความเหมาะสมในการรวบรวมเนื้อหาของข้อมูลนี้และภายใต้การควบคุมของทีมงานโครงการWorld Air Quality Indexหรือตัวแทนของโครงการจะรับผิดชอบต่อการทำสัญญาละเมิดหรืออื่น ๆ สำหรับการสูญเสียการบาดเจ็บหรือความเสียหายที่เกิดขึ้นโดยตรงหรือโดยอ้อมจากการจัดหาข้อมูลนี้



    Settings


    Language Settings:


    Temperature unit:
    Celcius