iNaturalist, A Cultivator of Community and Collector of Crucial Wildlife Data, Goes Solo
https://podcasts.google.com/feed/aHR0cHM6Ly9mZWVkcy5tZWdhcGhvbmUuZm0vS1FJTkM5NTU3MzgxNjMz/episode/Yjk1NzYzODItNThiYi0xMWVlLTg5OGEtOWYxNGY4MGVmYzUy?sa=X&ved=0CAIQuIEEahcKEwjQiJzrycCBAxUAAAAAHQAAAAAQLA
Heb je ooit een raar insect of plant gezien en gedacht: “Oh mijn God. Wat is dat?" Dan is iNaturalist, een uitvinding uit California, het sociale platform voor jou. Begonnen als een schoolproject, ontvangt het nu honderdduizenden maandelijkse natuurwaarnemingen van natuurliefhebbers over de hele wereld. Gebruikers plaatsen foto's van wat ze hebben gezien en waar ze het hebben gevonden, en mede-burgerwetenschappers, en vaak echte wetenschappers, helpen bij het determineren van de flora, fauna en habitat. Sommige iNaturalist-liefhebbers hebben zelfs nieuwe soorten geïdentificeerd. Nu wordt de site onafhankelijk met behulp van een subsidie van $10 miljoen. We zullen het verleden en de toekomst onderzoeken van deze opmerkelijke Bay Area-bijdrage aan ons collectieve begrip van de wereld.
Gasten:
Ken-ichi Ueda, co-director, iNaturalist
Scott Loarie, co-director, iNaturalist
Jennifer Rycenga, professor emeritus in the Humanities Department, San Jose State University; former president of the Sequoia Audubon Society in San Mateo.
Prakrit Jain, student of evolutionary biology, University of California, Berkeley
https://arxiv.org/abs/1906.05272
Ik ben het ermee eens dat het model aannames doet over de afwezigheid van soorten die misschien niet correct zijn, dat er vooroordelen kunnen zijn waar niet volledig rekening mee wordt gehouden, en dat de onzekerheid/fout in die voorspellingen veel groot is op plaatsen die niet goed zijn bemonsterd (beide fouten van commissie en weglatingsfouten) - en het expliciet modelleren van de waarschijnlijkheid om waargenomen te worden, los van de waarschijnlijkheid van voorkomen, is waarschijnlijk een goede toekomstige richting om beter om te gaan met deze vooroordelen.
je kunt hier en hier meer lezen over de methodologie. Als je de deep learning-locatiecodering eruit haalt, waardoor elke soort in wezen informatie van alle andere soorten kan putten, stort het model in tot een logistiek regressie-nichemodel (LR in tabel 1 in het eerste artikel). Maar een groot deel van de kracht van deze aanpak, in tegenstelling tot een nichemodel voor een enkele soort, is dat de soort leert van alle andere 80.000 soorten die worden gemodelleerd (net als het Computer Vision Model), zodat het model een goed gevoel krijgt voor gelijktijdig voorkomen. biogeografie en het soort dingen dat soortendistributies vaak doen zonder zo veel te moeten vertrouwen op ecologische covariaten alleen als steunpilaar zoals traditionele nichemodellen dat doen. Dit is de reden waarom de voorspellingen redelijk goed zijn als we alleen de hoogte als covariabele gebruiken en andere typische covariaten zoals neerslag enz. niet meerekenen. We hebben getest met het toevoegen van die covariaten en kregen geen significante verbetering, maar maakten het model wel ingewikkelder.
Ik ben het ermee eens dat dit slechts een babystapje is, er zijn veel mogelijkheden voor verbetering, en er zijn mogelijk verschillende benaderingen nodig om deze naar andere toepassingen en schalen te pushen. We zijn momenteel gefocust op het verbeteren van computer vision-suggesties, ook al ben ik ook enthousiast over sommige van deze toekomstige richtingen.