Menggunakan Jarak Statistik untuk Validasi Jaringan Sensor Real-time
Using Statistical Distances for Real-time Sensor Networks Validation

Posted on April 28th 2020
Membagikan: aqicn.org/faq/using-statistical-distances-for-real-time-sensor-networks-validation/id/
Overlapping kernel densities,
(credits)

Pada tahun 2008, ketika proyek Kualitas Udara Dunia dimulai, semua stasiun pemantauan kualitas udara yang ada didasarkan pada teknologi BAM dan TOEM yang sangat profesional dan mahal. Stasiun semacam ini selalu dipelihara oleh operator yang profesional dan berkualifikasi tinggi - dan ini memastikan keluaran stasiun ini dapat dipercaya.

12 tahun kemudian, stasiun BAM dan TOEM masih ada. Namun dengan berkembangnya teknologi hamburan laser dan sensor debu berbiaya rendah, jumlah stasiun BAM dan TOEM kini kalah jumlah dengan jaringan sensor berbiaya rendah yang sangat besar dan padat. Saat ini, ada begitu banyak jaringan tersebut - antara lain: urad, luft-daten, airqo, airbg, opensense, yakkaw, econet, airkaz, ccdc, ambente, green air, dll.

Salah satu masalah mendasar pada jaringan sensor berbiaya rendah adalah keandalannya: Karena banyak dari sensor tersebut tidak dirawat dengan baik (atau tidak dirawat sama sekali), jumlah sensor yang menghasilkan pengukuran yang salah tidak dapat diabaikan. Selain itu, sebagian besar jaringan tidak menggunakan stasiun dengan sensor yang direplikasi (tidak seperti stasiun Gaia kami, yang menggunakan 3 sensor yang direplikasi), sehingga semakin sulit untuk mengetahui kapan satu sensor gagal.

Dalam artikel ini, kita akan melihat jaringan sensor yang diterapkan di kota Volos yang indah di Yunani, dan mempelajari cara untuk memenuhi syarat dan mengukur keandalan stasiun secara real-time.


--

Kota Volos yang indah di Yunani

Volos (Yunani: Βόλος) adalah kota pelabuhan pesisir. Dengan jumlah penduduk 144.449 jiwa (2011), kota ini juga merupakan kota terpadat keenam di Yunani. Ini adalah pusat industri penting, sementara pelabuhannya menjadi jembatan antara Eropa dan Asia. Saat ini terdapat 5 stasiun di Volos: Satu dari EPA Yunani , menyediakan data setiap jam dari stasiun BAM profesional, dan 4 stasiun waktu nyata berbiaya rendah dari jaringan lutf-daten :



Stasiun Volos EPA terletak di gedung Administrasi Terdesentralisasi Thessaly dan Yunani Tengah . Semua stasiun lainnya juga berlokasi di kawasan pemukiman, kecuali Argonafton yang terletak di sebelah pelabuhan.

Lalu lintas di pelabuhan tidak dapat diabaikan, dengan rata-rata kedatangan/keberangkatan sekitar 8 kapal per hari , dengan 80% kapal adalah kargo - pada saat penulisan artikel ini.

Salah satu masalah yang umum terjadi pada kargo adalah polusi partikel dari pipa knalpot, akibat bahan bakar berkualitas rendah . Namun melihat panorama dari lokasi stasiun Argonafton, jarak ke kargo cukup jauh untuk tidak membenarkan adanya sumber polusi udara yang terus-menerus. Kita mungkin akan melihat beberapa kali polusi udara lebih tinggi di Argonafton, terutama saat perahu-perahu besar sedang bermanuver, namun tidak selalu. Toh, itu hanya 8 kapal yang bermanuver dalam sehari.


A view of the waterfrond of the town of Volos, Greece
(attribution: wikipedia)


--

Data rangkaian waktu 30 hari terakhir

Berdasarkan informasi dari lokasi stasiun, dapat diperkirakan bahwa semua stasiun sepakat mengenai tingkat polusi udara yang sama, kecuali kejadian polusi yang lebih tinggi secara sporadis di Argonafton. Namun sayangnya, hal ini tidak benar-benar terjadi, seperti yang dikonfirmasi dari plot grafik deret waktu di bawah ini:

Plot deret waktu dengan jelas menunjukkan bahwa data untuk Argonafton tampaknya melebihi perkiraan dibandingkan stasiun lain. Demikian pula, data untuk Dimarxou tampaknya di bawah perkiraan.

Cara terbaik untuk menyoroti masalah ini adalah dengan memvisualisasikan persentil AQI harian ke-75, yang diplot menggunakan rentang warna AQI yang sesuai. Penyimpangan dari Argonafton terlihat jelas. Selain itu, dimungkinkan untuk membedakan dua cluster yang berpusat di sekitar Riga-Feraiou+Kasthanaías dan Volos EPA+Dimarxou.


--

Mengukur perbedaan deret waktu

Saat membandingkan deret waktu yang berkorelasi, cara terbaik adalah membandingkan distribusi probabilistiknya. 3 grafik di bawah ini mewakili distribusi kepadatan, CDF (fungsi distribusi kumulatif) dan QQ (menggunakan Volos EPA sebagai referensi CDF). Ketiga grafik tersebut didasarkan pada data deret waktu 30 hari terakhir, namun Anda juga dapat memilih rentang waktu tertentu di grafik deret waktu pertama, dan 3 grafik tersebut akan diperbarui menggunakan nilai dari rentang waktu tertentu.

Melihat distribusi probabilistik dengan mata telanjang, terlihat jelas bahwa terdapat perbedaan besar antara Argonafton, Dimarxou dan stasiun referensi Volos EPA. Perlu diperhatikan bahwa ada "benjolan" di sekitar AQI 150: Alasannya adalah bahwa plot distribusi didasarkan pada AQI daripada konsentrasi mentah, dan kisaran AQI yang lebih kompak [150,200] (dibandingkan dengan [100,150]) membuat AQI lebih padat untuk >150 dibandingkan dengan <150.

Ketika mengukur perbedaan ini, konsep jarak statistik dapat digunakan untuk mengukur "kesesuaian". Jarak yang paling terkenal adalah jarak Kolmogorov-Smirnov, Wasserstein dan Cramér-von Mises (untuk pengenalan yang baik tentang jarak tersebut, lihat penjelasan yang sangat bagus ini). Tabel di bawah menunjukkan jarak berdasarkan data 30 hari (nilai akan diperbarui jika Anda memilih rentang waktu dari grafik deret waktu utama).

Station
Kolmogorov-Smirnov
Wasserstein
Cramér-von Mises

Meskipun jarak Kolmogorov-Smirnov tidak menangkap jarak relatif dengan tepat (menyoroti Dimarxou sejauh Argonafton), jarak Wasserstein dan Cramér-von Mises menyoroti jarak yang jelas lebih besar untuk Argonafton. Nilai dalam tabel di atas didasarkan pada data 30 hari. 3 grafik di bawah ini didasarkan pada rata-rata pergerakan 7 hari selama 30 hari terakhir.

Grafik tersebut mengkonfirmasi bahwa dengan menggunakan jarak Wasserstein atau Cramér-von, jarak dari stasiun Argonafton dan Volos EPA secara konstan setidaknya dua kali lebih jauh jarak dari stasiun lainnya.

Mengkorelasikan Data Meteorologi

Untuk mengkonfirmasi hipotesis bahwa stasiun Argonafton menghasilkan pembacaan konsentrasi yang abnormal dan berlebihan, kita perlu melihat data meteorologi: Kondisi di mana stasiun Argonafton dapat melihat konsentrasi yang lebih tinggi adalah ketika angin bertiup dari selatan, yaitu dimana angin akan membawa muatan asap pipa knalpot menuju stasiun.

Langkah pertama adalah memeriksa rata-rata arah dan kecepatan angin selama 30 hari terakhir. Data angin diperoleh dari stasiun METAR Bandara Volos dan stasiun cuaca Netatmo Tthiseos . Dua mawar angin mewakili berapa kali angin bertiup di setiap arah.

Kedua plot mawar angin menunjukkan bahwa angin sebagian besar bertiup dari Barat atau Timur dan lebih sedikit dari Selatan. Karena terdapat pegunungan di bagian utara Volos, tidak ada angin dari utara di bawahnya.

Berdasarkan konfirmasi empiris bahwa angin bertiup lebih sedikit dari selatan dibandingkan arah lain, tidak mungkin untuk menyimpulkan bahwa pipa knalpot kargo adalah penyebab tingginya konsentrasi PM 2.5 di stasiun Argonafton. Hipotesis ini juga tidak valid dengan plot korelasi antara 3 stasiun dan arah angin Bandara, yang menunjukkan bahwa tidak ada bukti jelas (untuk stasiun mana pun) bahwa angin selatan menunjukkan konsentrasi tinggi.

Terakhir, kita juga perlu memeriksa apakah masalah pada Argonafton mungkin terkait dengan kelembapan relatif. Masalahnya bisa jadi, misalnya, karena kelembapan yang lebih tinggi membuat ukuran partikel menjadi lebih besar sehingga menyebabkan konsentrasi yang lebih tinggi. Plot korelasi di bawah menegaskan bahwa hal ini tidak benar, karena tidak ada bukti jelas bahwa konsentrasi sebanding dengan kelembapan.

Kesimpulan

Dalam artikel ini, kita telah melihat cara mengukur dan mengkualifikasi kualitas data untuk stasiun real-time. Dengan asumsi bahwa terdapat stasiun referensi tepercaya, kami telah menunjukkan bahwa penghitungan menggunakan jarak Cramér-von Mises atau Wasserstein dapat menunjukkan masalah pada data stasiun mana pun.

Kami juga telah menunjukkan bahwa jarak saja tidak cukup, dan lebih tepatnya, konteks stasiun harus dipahami. seperti lokasi dan kondisi meteorologi. Namun, karena konteksnya bukanlah sesuatu yang dapat diotomatisasi, solusi akhir yang digunakan untuk proyek WAQI terdiri dari stasiun yang memenuhi syarat yang jarak statistiknya ke stasiun referensi kurang dari 1/4. Hal ini akan diberlakukan dalam beberapa minggu mendatang (lihat aqicn.org/station/ untuk peta stasiun real-time.

Artikel ini adalah bagian dari seri, dan pada artikel berikutnya, kita akan melihat stasiun yang memenuhi syarat di mana tidak ada stasiun referensi yang tersedia.


--

Volos promenade by night
Klik di sini untuk melihat semua entri FAQ
  • AQI Scale: What do the colors and numbers mean?
  • Using Statistical Distances for Real-time Sensor Networks Validation
  • Nitrogen Dioxyde (NO2) in our atmosphere
  • Tentang Pengukuran Kualitas dan Polusi Udara:

    Tentang Tingkat Kualitas Udara

    -Nilai Indeks Kualitas Udara (AQI).Tingkat Kekhawatiran Kesehatan
    0 - 50BaikKualitas udara dianggap memuaskan, dan polusi udara menimbulkan sedikit atau tanpa risiko
    51 -100ModeratKualitas udara dapat diterima; Namun, untuk beberapa polutan mungkin ada kekhawatiran kesehatan yang moderat untuk sejumlah kecil orang yang sangat sensitif terhadap polusi udara.
    101-150Tidak Sehat untuk kelompok orang yang sensitifAnggota kelompok sensitif dapat mengalami efek kesehatan. Masyarakat umum tidak mungkin terpengaruh.
    151-200Tidak sehatSetiap orang mungkin mulai mengalami efek kesehatan; anggota kelompok sensitif dapat mengalami efek kesehatan yang lebih serius
    201-300Sangat Tidak SehatPeringatan kesehatan untuk kondisi darurat. Seluruh penduduk lebih mungkin terpengaruh.
    300+BerbahayaPeringatan kesehatan: semua orang mungkin mengalami efek kesehatan yang lebih serius

    Untuk mengetahui lebih banyak tentang Kualitas dan Polusi Udara, lihat topik Kualitas Udara di wikipedia atau panduan airnow tentang Kualitas Udara dan Kesehatan Anda .

    Untuk nasihat kesehatan yang sangat berguna dari Dokter Beijing Richard Saint Cyr MD, periksa blog www.myhealthbeijing.com .


    Pemberitahuan Penggunaan: Semua data Kualitas Udara tidak divalidasi pada saat publikasi, dan demi jaminan kualitas maka data ini dapat diubah, tanpa pemberitahuan, kapan saja. Proyek Indeks Kualitas Udara Dunia telah menerapkan semua kemampuan dan kepedulian yang cukup dalam mengumpulkan isi informasi ini dan dalam keadaan apa pun World Air Quality Index tim proyek atau agennya bertanggung jawab dalam kontrak, gugatan atau jika ada kerugian, cedera atau kerusakan yang timbul secara langsung atau tidak langsung dari pasokan data ini.



    Settings


    Language Settings:


    Temperature unit:
    Celcius