walden

life in the woods

2016.07.28. 13:21

Lásd még: algoritmus távérzékelés erdőterület Adattár

faállományok automatikus felismerése ortofotókon

Update 2018.04.13. Az utóbbi napokban valaki rongyosra olvasta ezt a posztot Veszprémből. Könyörgöm, ha ennyire érdekel, írj [erdeszpolitikus kukac gmail pont com], beszéljük meg. Nagyon szívesen válaszolok.

***

Összeraktam egy módszert, amivel ortofotókon automatikusan felismerhetők és lehatárolhatók az erdőfoltok (faállományok). Még nincs kész, de azon már túl van, hogy nagyon ígéretesnek mondjam.

Az utóbbi 10 évben fokozatosan világossá vált, hogy az országban a FÖMI nyerte meg a térinformatikát, azt a versenyt, hogy kinek lesz pénze adatgyűjtéseket végezni (légifényképeket készíteni) és know-howt felhalmozni. Gyakorlatilag egyeduralkodók lettek ezen a kulcsterületen. Aktuális ortofotókat a FÖMI készít Mo-on, és az EU-s területalapú támogatások adminisztrációjához felállított MePAR rendszerhez használja őket elsősorban, de egyéb célra megvásárolhatók és online is elérhetők. A teljes országos anyag ára meghatározhatatlan, mert így egyben nem vett még meg senki, egyetlen intézmény sem, de a területegységre adott ár alapján olyan 100-200 millió forintra tehető.

Az erdészeti igazgatásban használt MePAR-ortofotók, amikhez én is hozzáférek:

  • valódi színesek (RGB, infra-csatorna nélkül),
  • pixelméretük 40×40 cm (minden eddiginél jobb felbontásúak),
  • vegatációs időben készültek (zöldellő növényekkel borított a táj),
  • EOV-szelvényenként férhetők hozzá (4099 db, egyenként 4×6km-t lefedő kép),
  • a korábbiakhoz képest meglehetősen egységes tónusúak (tehát a FÖMI-ben képmanipulációs eljárásokkal megoldották a különböző légifényképek eltérő színeinek összedolgozását),
  • elképesztően részletgazdagok, az egyes fák kis bolyhos koronái külön látszanak, nagyon szépek.

13-144_o_2015_600x400.jpg

Úgy voltam vele, hogy a faállományok automatikus felismerése lehet, hogy nem sikerül, de lesülne a bőr a képemről, ha meg sem próbálnám.

A módszernek semmilyen általam ismert előzménye nincs, nem olvastam utána, hogy ilyen felbontású fotóanyagból csináltak-e erdő-felismerést korábban mások. Felszínes tájékozódásom alapján a jelenlegi trend inkább a mintázat-felismerés felé húz.

Az egész eljárás adatbázis-kezelő szoftveren fut, hiszen csak matek; mindössze a térbeli összerendeléseket illetve az eredmények vizuális ellenőrzését és demonstrációját végeztem közönséges térinformatikai alkalmazásokkal (ArcView, QGIS).

1. Csempék

Osszuk fel az EOV-szelvényt (az ortofotót) csempékre (egyforma négyzetekre). A csempe legyen:

  • 50×50 pixel, azaz 20×20 méter nagyságú (nagyjából egy fa koronavetületének megfelelő méret, és 20 méter a FAO szerinti erdődefinícióban is az erdőfolt minimális szélessége - egy fányi széles, magyarán),
  • területe 400nm (ami megegyezik a fásítások méretének alsó határával a földhivatali tulajdon-nyilvántartásban),
  • 60ezer csempe van egy szelvényen,
  • az RGB-csatornák színintenzitás-eloszlásáról 3db hisztogram vezethető le (a vízszintes tengelyen a szaturáció 0-255 közötti).

296x000_vs_13-144_node_erdo006_hist.png

Más méretet is lehet választani, és majd ki is fogok próbálni más csempeméreteket is, de főleg amiatt kezdtem el 50×50 pixellel dolgozni, mert az egyes fák koronamérete közel ekkora, pontosabban ennél nem nagyobb. Eddig érdemes lefelé menni, ebben a méretben ragadhatók meg az erdőborítás meghatározó képi tulajdonságai, illetve más vegetációs formáktól való különbözősége. Kisebb méretben (pl. 5×5 pixelen) minden hasonló vegetációtípus hasonlóan néz ki: zöld. A nagyobb méret pedig rontaná az eredmény felbontását.

A 3 hisztogram a mintázaton kívül (tehát attól eltekintve, hogy az egyes pixelek milyen elrendezettségben vannak a csempén), minden képi információt hordoz a csempéről. Afféle ujjlenyomatai a vegetációnak, és további előnyük, hogy matematikailag jól kezelhetők.

2. Miben különböznek más felszínborítási formák az erdőtől a képen?

Pl. a szántók (egyes, bizonyos növénykultúrákkal fedett vagy éppen poros szántók) egészen más színűek. Ami a hisztogramokon úgy ragadható meg, hogy az eloszlások középértékei máshol vannak.

szanto-erdo.png

Pl. a rétek ugyanolyan zöldek, mint az erdő; de egy rét lapos, és nincsenek rajta árnyékok, míg a fák koronái egymás mellett egy hepehupás felületet adnak, a fák koronái egymásra árnyékokat vetnek, ami a hisztogramokon úgy látszik, hogy az erdőnél sok a sötét tónus, és a hisztogram emiatt szélesebb.

ret-erdo.png

3. Hisztogramok összevetése

Két hisztogram összehasonlítható, ha egymásra teszed őket. A hasonlóság pedig számszerűsíthető is az egyes intenzitás-értékekhez (0-255) tartozó oszlopmagasságok összevetésével. A két hisztogram ilyenkor két darab, egyenként 256 attribútumot hordozó objektumként tekintendő, s rájuk valamilyen távolságfüggvényt kell alkalmazni.

hisztogrmok_osszevetese.png

A szakirodalomból megismerhető távolság-függvények közül kettő vált be:

  • a korrelácia (COR, a klasszikus, két változó kovarianciájára épülő statisztikai mérőszám, lásd Podani p89, 3.70);
  • a hasonlóság-index (SIM, similarity-ratio, lásd Podani p89, 3.71, és a mester sem említi az eredeti szerzőt).

A COR [-1..+1] tartományban, a SIM [0..+1] tartományban méri a hasonlóságot. Mindkettőre igaz, hogy ha a hasonlóség 1, akkor a két hisztogram teljesen azonos; és minél inkább különbözik a két hisztogram, annál inkább különbözik a hasonlóság mértéke 1-től.

4. Prototípusok

Az Országos Erdőállomány Adattárban nyilvántartott erdők elhelyezkedése és tulajdonságai (pl. faállomány-típus, záródás, kor stb.) ismertek, és az egyes szelvényeken minden egyes csempéhez hozzárendelhetők. Az egyes erdőrészletek homogén foltjaira eső csempéinek halmazához hozzárendelhető 3-3 átlagos hisztogram, ezzel az adott állományszerkezetre jellemző prototípusok jönnek létre.

proto_reszlet_alapjan.png

A homogén foltok azonosítását egy klaszterezési eljárással végeztem, ami hasonlít az UPGMA-módszerhez, de a végén a csoportképzés, pontosabban az eredményül kapott csoportok elfogadása azok belső homogenitása alapján történik. Azok a foltok lesznek jók prototípusnak, melyek csempéi hasonlítanak egymásra.

A homogén foltok egyébként az erdőleírás korábbi "állományrész" fogalmával rokon valamik.

Egy szelvényen nagyjából 0-300 erdőrészlet fordul elő, átlagosan 70-100 darab. Homogén folt vagy állományrész részletenként 1-3 féle szokott lenni, tehát szelvényenként pár száz prototípust kell kezelni.

A prototípusok elvileg más referencia-adatokból (faállományok terepi megfigyeléséből) is levezethetőek lennének, pl. a szisztematikus erdőleltár (EEM) mintapontjaiból, de ezekhez az adatokhoz egyelőre nem férek hozzá.

5. Osztályozás

Menjünk végig a szelvény összes csempéjén, és minden egyes csempéjét hasonlítsunk össze minden egyes prototípussal. Az adott csempe ahhoz a prototípushoz rendelhető, amelyik prototípushoz mért hasonlósága a legnagyobb. És ha a csempe hisztogramjai hasonlítanak egy prototípushoz, akkor úgy is néznek ki, továbbá feltételezhető, hogy a csempén olyan faállomány van, mint a prototípusé.

6. Eredmények

Az első tesztek alapján jól működik, várakozásokon felül jól.
Elválik a rét az erdőtől.
Megtalálja a házak közt a szoliter fákat.
Viszont elvéti a zöld csíkos szántót (talán kukoricás lehet).
Jelenleg fix >=0,80 hasonlóság felett tekintek erdőnek egy csempét, tehát ha van olyan prototípus, amihez mért hasonlóság ennél nagyobb, akkor az erdő. De ez nagyon kezdetleges threshold, és fejlesztésre szorul.
Eddig csak a vörös (R) csatornát használtam az osztályozáshoz, de a vegetációra vonatkozó információ a zöld csatornán is sok van, és lehet, hogy végül a 3 csatorna valamilyen lineáris kombinációját vagy főkomponensét kell majd alkalmazni.
Az alapokat így is tudja.

osztalyozas_erdo_nemerdo.png

Eddig kb. 150 munkaóra van a fejlesztésben, és eddig 1 szelvényen kísérleteztem (13-144 szelvényszámú, Somogyban van, Patapoklosi nevű falu környéke, lásd fent).

7. Perspektívák

Továbbmenve: elvileg bármilyen felszínborítás felismerhető, nem csak az erdő, ha prototípusok gyárthatók hozzá.

Az erdővel az a szerencse, hogy az Adattár személyében nagyon nagy területi lefedettségű minta áll rendelkezésre, és ez a tanulóterület pontos koordinátákkal lokalizált is. Jelenleg a csempéket az EOV-szelvényen belül fellelhető prototípusokkal vetem össze, de elvileg, ha az ortofotók valóban egyformák, azonos tónusúak, akkor nincs akadálya annak, hogy a szelvényen kívüli prototípusokat is használjak.

A prototípusokon keresztül minden csempéhez faállomány-leírás rendelhető, az erdő területén és elhelyezkedésén túl minden olyan leíró statisztika előállítható, ami a referencia-adatokban megvan (pl. fakészlet). Ha az Adattárat használjuk referenciának (= az Adattárból gyártom a prototípusokat), a módszer az Adatáron kívüli faállományokat azonosítja. Ha a szisztematikus leltárból indulok ki, mely sokkal kisebb területi lefedettségű mintát jelent, a feladat az erdőborítás térképének előállítása (lásd többforrású erdőleltár). De mindkét esetben az országos teljes erdőállomány leírására a cél, a csempéknek megfelelő területi felbontásban.

A precíz erdőtérkép levezetéséhez az eredményből ki kell maszkolni a nem-erdő fás vegetációkat (pl. gyümölcsösök). Továbbá az eljárás gyorsítására ki lehet maszkolni a biztosan nem-erdő területeket (pl. belterületek, utak, nagy vizek stb.). Azután szűrni kell az egész csempe-halmazt, mert pl. az erdődefiníciók kikötik, hogy az erdőfolt minimális mérete fél vagy egy hektár legyen, és be lehet foltozni a túl kis lékeket az erdőterületen belül - de ezek mind rutin térinformatikai feladatok, amikhez innováció nem nagyon kell, csak megfelelő alapadatok.

***

Köszönet Tóth Gábornak, aki lekódolta nekem C#-ban az ortofotók pixeleinek felolvasását, illetve a csempénkénti hisztogramok és alapstatisztikák legyártását. Az általam használt szoftverben csak olyan lassú megoldást lehetett kiizzadni, ami agyonvágta volna az egész projektet.

Köszönet Benedek Gábornak sokrétű támogatásáért.

Irodalom:
Podani János: Bevezetés a többváltozós biológiai adatfeltárás rejtelmeibe (Scientia Kiadó, Budapest, 1997, ISBN 963 8326 06 9)

komment

2016.03.27. 17:25

Lásd még: színes megmondás

IT Internacionálé

A győzelem appjai jönnek.

komment

2016.03.05. 08:56

Lásd még: így köztisztviselő

a függetlenségről

"Az Élesztő sohasem pályázik semmire, mert a vállalkozás tulajdonosai úgy gondolják, hogy minden pályázati pénz elfogadása korrumpál ideológiailag, szakmailag és emberileg. A közpénzből osztogatott pályázatok minden esetben idomítják a pályázaton indulók céljait a pályázatkiíró céljaihoz. Mi enélkül is pontosan tudjuk, hogy mit akarunk, és nem szeretnénk, hogy a többi adófizető finanszírozza a kísérletezéseinket, jobb szeretjük a kockázatokat és a következményeket is magunk vállalni. Azt sem akarjuk, hogy a teljesítményünket általunk nem ismert kompetenciájú személyek mérjék meg, egy pályázaton való elindulással pedig elfogadnánk, hogy a kiírók minősítsenek és rangsoroljanak minket egy ismeretlen szempontrendszer alapján. Ennyit általánosságban (...)"

(Egy hipszter sörfőzde a facebookon, via nol.hu.)

Így kell élni, s mégis az államtól kapom a fizetésemet. Az én kompromisszumom az, hogy tudom, hogy így kellene élni, és azt is tudom, hogy egyszerű szűrők alkalmazása után (szakterület + nyelv) nincs más választásom.

komment

2016.01.20. 10:06

Lásd még: távérzékelés FNM fatermési tábla Adattár

a távérzékelés következő 10 éve

Ahhoz, hogy kb. a fatermési táblás (8) becsléshez hasonló pontosságú adatokat (fakészlet, növedék) lehessen nyerni részletszinten (kb. 1ha-os felbontásban) távérzékelt adatokból - ahhoz 3 adat kell.

1. Állománytípus.
Most direkt nem írom, hogy 101 elemű faállománytípus vagy 23 elemű célállomány, és valószínűnek tartom, hogy inkább 20 körül lesz a megkülönböztetett típusok száma.
Több vélemény és előzmény ismeretes.
- Jagicza Attila szerint az 1990-es években is lehetett ortofotóról pixelcsoportokat azonosítani (tölgyes, cseresznye, kőrisek - kisebb foltokat).
- Multispektrális felvételeken a fafajoknak elég jól azonosítható profiljuk van. Ilyen vizsgálatot 5-20 hektáros méretben ismerek (Bozsik Éva).
- A tavaszi, virágzás környéki fenológiai fázisban fotózott 3-4 képet is elég használhatónak mondják (Czimber Kornél).

2. Magasság (és/vagy kor).
A LiDAR technológiával 5-20 hektáros méretben már vannak kiértékelt kutatások (Király Géza, Bozsik Éva) a magasság mérésére.
A FÖMI tervezi domborzat- és felszínmodell országos előállítását, szó van teljes országos LiDAR-repülésekről is (Maucha Gergely). A magasságot kisebb pontossággal meg lehet csinálni fotogrammetriai úton is.

A faterméstani modellek üzemeltetéséhez (pl. fatermési táblák, vagy azok valamilyen egyszerűsítésének használatához) a faállomány magassága (átlagos vagy felső magassága) és kor szükséges a fatermési táblák hagyományos koncepciója szerint. A kor távérzékelés-alapú mérése nem látszik megoldhatónak, sokkal elterjedtebb a magasság mérése vagy becslése. Faterméstani szempontból a kor és a magasság erősen korrelált, a két mennyiség közül az egyik kiesése ugyan pontatlanabbá teszi a becsléseket, de nem katasztrofális.

3. Erdőborítottság / sűrűség / záródás.
Lásd a GIO HRL (az ESA nagy felbontású űrfelvételei alapján készített területosztályozások), annak TCD (tree cover density, ami elvileg a záródással egyenértékű) és FTY (forest type, fenyő-lombos bontásban) termékei. NDVI-alapú indexekből készülnek. 20×20 méteres felbontású fedvény érhető el 2012-re vonatkozóan, ingyen, 3 évente lesz ismétlés. A TCD alapján az erdőborítottság 1ha-os nagyságrendű (vagy finomabb) területi változásainak követése, lokalizálása lehetséges. Ez tehát már megvalósult (nevezzük bétának, mert még azért fejlődhet bőven).

És kellenek terepi mintavételek a fakészlet és növedék becsléséhez, hogy legyen mit kiterjeszteni a fenti osztályozó paraméterek alapján. Az EEM vagy az Adattár egyaránt megfelelő. Nincs feltétlenül szükség ugyanabban az időben, párhuzamosan végzett mérésekre sem. Ahogy a fatermési táblák használhatók évtizedekig, a fakészlet és a növedék viszonyítási alapja is hosszútávon felhasználható változtatás nélkül.

Most annak próbálok majd utánajárni, hogy a fenti adatgyűjtések hol tartanak jelenleg és milyen lehetőségek vannak az iparszerű (nagy egybefüggő területű, vagy kiterjedt mintavételes) alkalmazásukra, pontosabban mi kell ahhoz, hogy ilyenek készüljenek. Mennyibe kerülnek, kik a szolgáltatók, hol van erre agykapacitás stb. Nyilván a 20ha-os kutatói kézművesség és az évi 200ezer ha (körzeti erdőtervezés) lerepülése közti átmenet finanszírozását és szervezési feladatait nem lehet megúszni.

Remélem, hogy 10 éven belül eljutunk odáig, hogy ilyen modellekkel dolgozzak. Illetve biztos vagyok benne, hogy még megérem.

Az adatok valószínűleg nyilvánosan elérhetők lesznek (lásd ESA) vagy valamilyen nagy ernyőprojektben fognak elkészülni (FÖMI), és széles körben hozzáférhetők lesznek. Adat lesz, a kérdés az, hogy fogjuk-e tudni használni.

komment

2016.01.03. 15:48

Lásd még: megmondás így

cél

Legyenek megkerülhetetlen eredményeid.

komment

2015.11.11. 10:36

az erdészeti szaporítóanyag-termelés

Az erdőgazdálkodásban olyan szaporítóanyagot kell használni, amely biztosítja a környezetéhez jól alkalmazkodott, genetikailag változatos erdei ökoszisztémák kialakulását, az erdőben élő fajok evolúciós képességének megőrzését, és amely egyúttal növeli az erdők gazdasági értékét is.

Például a fenyők ágszerkezete nagyon változatos a sok millió éves evolúciós alkalmazkodás következtében. A széles korona a mediterránum jellemzője, míg a keskeny korona a havas, ill. északi tájaké. A kétféle származású (és eltérő biológiai adottságú) csemete fiatal korában közel ugyanúgy néz ki, és az erdész számára fontos különbség csak idős korban mutatkozik meg. A szaporítóanyag biológiai tulajdonságairól legkönnyebben a kereskedelmi lánc nyomonkövetésével lehet meggyőződni.

fenyok_agszerkezete_600.jpg

Az erdészeti szaporítóanyag útját nyomon követő felügyeleti rendszert 1968 óta működteti az állam. Erre azért van szükség, mert állami támogatásokon keresztül az adófizetők jelentős összegeket költenek az erdősítésekre, és az ott felhasznált szaporítóanyag évtizedekre meghatározza az erdők egészségi állapotát, gazdasági teljesítőképességét, és nem utolsósorban a tájképet is.

A felügyeleti rendszer keretében a hatóság nyilvántartást vezet a szaporítóanyag-forrásokról, a csemetekertekről, a forgalmazókról és a forgalomba kerülő szaporítóanyagokról, biztosítva ezzel a szaporítóanyagok teljes nyomonkövetését, a genetikai információk hiteles átadását.

Az erdőtelepítések éves területe 1996-2014 időszakban 2,5-19,0 ezer ha között jelentős ingadozást mutatott. Az erdőtelepítési csúcsok közel egybeesnek az akác és a nyár szaporítóanyag termelési csúcsaival, mert ezek évente teremnek bőségesen és magjuk könnyen gyűjthető a magtermelési célra kijelölt állományokból. A 3-5 évente termő tölgyek vagy az 5-10 évente termő bükk esetében sokkal nehezebb reagálni a változó felhasználási igényekre. A szaporítóanyag-termelés biológiai alapjainak megőrzése és fenntartása ezért kiemelten fontos feladata az erdészeti ágazatnak.

szapanyag_diagram_600.jpg

***

(A 2015-ös kiadású leporellóból nagy viták után letiltott anyag, just for the record. Elég sokat dolgoztunk rajta, érvelt az állami szolgáltatás szükségessége és haszna mellett, nem mellesleg érdekes volt,
de. Hárompont.

A szaporítóanyag-termelés mennyiségi mutatóiról szóló ábra Babinyec Ferenc munkája, a fenyők ágszerkezetésről szóló illusztrációt Dr. Bordács Sándor és Pintér Beáta kollégák adták.

a szerk.)

komment

2015.10.23. 14:41

Lásd még: klímaváltozás megmondás megújuló nettó

köszönöm, hogy elmondhattam

Most vesztem össze az AKI-val (Agrárgazdasági Kutató Intézet, nehogy el lehessen téveszteni, név szerint bizonyos Garay Róbert), amiért nem jelölte tisztességesen az adatforrásait a tárgyévi Agrárjelentésben, illetve fogalma sem volt, hogy az idézet számok (konkrétan tűzifa-kitermelés idősor) honnan származnak, (természetesen az erdészeti igazgatásból), a szakkifejezések mit jelentenek. Lett purpárlé, elnöki intő, most mindenki meg van sértődve.

A KSH (Valkó Gábor) tegnap küldött egy felkérést egy EU-s finanszírozású projekt támogatására: első körben listáznunk kellene a nemzetközi adatszolgáltatásainkat, amiből kiindulva harmonizálni kívánják majd az adatszolgáltatásokat, ami nyilvánvalóan a feladatok újragondolása és intézmények közti újraosztása követ majd, valamikor. És ebben még van is ráció.

Az erdőt érintő adatok meghatározó része az erdészeti igazgatás adatgyűjtéseiből származik, s habár a dominancia gyöngül, még mindig monopol-helyzetnek mondható. (Most kellene ide egy lábjegyzet, hogy szerintem azért ez nincs rendben így, utána meg egy másik, hogy hát tetszettek volna beruházni az adatgyűjtésekbe.) És ugyanez igaz az adatok értelmezését lehetővé tevő kompetenciára is.

A konkrét mások helyett elvégzendő munkán túl (tehát pl. hogy adjak számokat, vagy pontosítsam a számokat, amiket valaki valamilyen jelentéshez, jellemzően állami finanszírozású megbízásos melókhoz összeszedett, értsd pénzt kap érte, és magyarázzam el, hogy mit jelentenek, és akkor ez majd belekerül az ő anyagrészébe, amit ha kedvem van, még korrektúrázhatnék is) ...

szóval sokkal kellemetlenebb hosszútávon, hogy az AKI-nál és a KSH-nál kezdődött meg a tudatos építkezés az agrár- és környezet-statisztikai értelmező szerepek betöltésre. A KSH-nál 3-4 éve álltak rá erre, az AKI-nál most kezdenek el embereket felvenni kifejezetten erdészeti kompetenciával. Erdészeti-faipari-megújulós-ühg területen publikálnak és a NÉBIH EI által gyűjtött adatokat interpretálják így-úgy. Egyelőre rosszul és félamatőr módon, de miért lennének buták, nem azok, tanulnak. A KSH legalább tisztességesen megjelöli a forrásokat, de az AKI még ennyit sem.

Ezek a projektek az adatok elkérésének és felhasználásának korszaka után a szakértelem megszerzésére irányulnak, s mert máshol van rá finanszírozás és ember, a tudástranszfer meg is fog történni; közben pedig ez a finanszírozás elképesztően hiányzik az adatgyűjtésekből, lassan 10 éve nem tudok egyszerre legalább két embert üzemben tartani statisztikai szerepkörben, hogy ha az egyik lelép vagy átirányítják, legyen aki átveszi a feladatokat, és ne kelljen a nulláról indulni.

komment

2015.07.07. 16:50

Lásd még: megmondás prognózis Király prof Agrárklíma 2

politika vs modellek

Néha az az érzésem, a hozamszabályozás (vagy -vizsgálat) azért lehetett a magyar erdészeti gyakorlat része, mert Király profnak elhitték, hogy ezeket a kérdéseket számokkal és mátrixokkal is meg tudja válaszolni úgy, hogy a kockázatos szakmapolitikai érvekkel nem is kell a kérdéshez nyúlni. Hogy a mátrixok szenvtelen, súlytalan és éteri mechanikája elfedi ezeket a döntési helyzeteket.

komment

2015.06.19. 14:13

Lásd még: algoritmus FNM

a Fadgyas-képlet torzításai #4

A különböző mintakör-területszámítási képletek összehasonlítása a szórásra is érdekes.

450nm-es fix kör felett (ahol érvényesül, hogy a kellően nagy számú faegyed már reprezentálja az állományszerkezetet, a törzsek területfoglalását, egymáshoz való viszonyát) a gyűrűfelezés mindenhol kisebb szórású is, mint a Fadgyas-képlet. És minél nagyobb a mintakör, annál jobban működik a gyűrűfelezés.

fix_vs_all_compare_v04_szorasok_600.jpg

A szórás Fadgyasnál a mintakör méretének növekedésével folyamatosan nő, a gyűrűfelezésnél kb. 500nm-nél stabilizálódik.

(És mintha ez a 450-500nm valaminek a létező határa lenne az állományszerkezetre nézve, lásd a fenti, állományszerkezetre vonatkozó, de nem túl egzakt megfogalmazást.)

komment

2015.06.11. 14:54

Lásd még: algoritmus FNM

a Fadgyas-képlet torzításai #3

Az FNM-mintakörök területének számításához használható képletek összehasonlításához olyan teszteket futtattam, amiben az FNM-pontokon (3. ciklus, kb. 5700 mintapont) mértem mind a 4 megoldás (fix mintakör, Fadgyas-féle, gyűrűfelezés, átlagos gyűrű) által adott mintakör-területeket úgy, hogy egy FNM-mintakörön mind a 4 eljárás ugyanazt az n db fát használta. Tehát megnéztem, hogy a fix sugarú mintakörben hány fa van benne, és pont ezekre a fákra használtam a másik három képletet.

Például tekintsük az 500m2-es mintakört, és az ehhez tartozó fix 12,62 m-es sugarat. Vegyük az összes FNM-mintapontot, ahol a legtávolabbi fa messzebb van a középponttól, mint 12,62m, azaz elfér az 500m2-es fix kör, és ezen a sugáron belül biztosan minden fa meg van mérve. Tekintsük azokat a fákat, amik beleesnek az 500m2-es körbe, és ugyanezekre a fákra számítsuk ki mindhárom képlettel a mintakör területét. Így a különböző területszámítások összehasonlításánál a származtatott m3/ha élőfakészletet csak a mintakör sugara befolyásolja. Számítsuk az így kapott mintakör-területek átlagát.

A vizsgálat lefutott különböző fix területű mintakörökre (50m2-től 1000m2-ig, 50m2-es ugrásokkal, azaz 20-szor).
Nyilván 50m2-es kör használható volt majdnem minden FNM-ponton, az 1000m2-es meg csak 326 darabon, mert csak 326 FNM-mintapont volt elég nagy hozzá. A cél a skálázási hatás vizsgálata volt.

fix_vs_all_compare_v03_600.jpg

Az jött ki, hogy a Fadgyas-féle képlet átlagosan 4-5%-kal alulbecsli a fix sugarú körök területét. Ez nagyjából ennyivel nagyobb átlagos élőfakészletet (m3/ha) jelenthet. Illetve, hogy a gyűrűfelezés pedig 0-1%-kal becsli fölé azt. (Szóval nagyon szimpatikus. Nagyon érdekes, hogy az első külső fa helyzete, mint plusz információ, milyen sokkal javítja az eredményeket.) Az átlagos gyűrű néven futó módszer nem ad jó eredményeket.

Nagyon hiányzik egy elméleti leírás a körös mintavételekről, a mintakör területét számító képletekről, azok előnyeiről és hátrányairól, a fák bekerülési valószínűségéről, amit intuitív módon ezekkel a gyűrűs játékokkal próbáltam megfogni.

A mintába kerülés valószínűsége csak a középponttól mért távolságtól függ, ennek az elméletét a szakirodalom tárgyalja, nem kell újra kitalálni. Megkértem Gál János docens urat, hogy segítsen irodalmat találni (folyamatban).

A fix sugarú körök standardnak (torzítatlannak) tekinthetők az országos élőfakészlet meghatározásánál, ahol arról van szó, hogy az erdősült területen mennyi fa van. Ebben egyetértettünk Gál docenssel.

Megfontolásra ajánlom az FNM-ből levezetett országos élőfakészlet számítások újragondolását egy olyan módszerrel, ahol az FNM-mintakörökben az utolsó fa adataiból csak annak pozícióját használnánk fel, és az n-1 db fát tekintenénk mintának, a mintakör területét pedig a gyűrűfelezéses módszerrel számolnánk újra.

komment

2015.06.11. 14:44

Lásd még: algoritmus FNM

A Fadgyas-képlet torzításai #2

A legegyszerűbb körös mintavétel fix sugarú körökkel dolgozik, és ez a módszer tekinthető a területen levő faállomány torzítatlan becslésének.

A fentiekből kiindulva csináltam egy olyan eljárást is, amit "gyűrűfelezés" néven használok, és arról szól, hogy ha ismerjük a mintakörön kívüli első külső fa helyzetét is, akkor a mintakör területe számítható az első külső fa és az utolsó belső mintafa közé rajzolt körrel, mely kör felezi a két fa közti gyűrű területét. Ekkor minden egyes fához olyan gyűrű tartozik, aminek az adott fa a "közepén" áll (idézőjel).

Ez tulajdonképpen a mintakör egydimenziós ábrázolásának a logikus folytatása: ha gyűrűk adódnak hozzá a mintakörhöz az egyes fák belépésével, akkor az utolsó fához tartozó gyűrű területét is úgy kell levezetni, mint az összes többiét korábban.

(Biztos van neve a szakirodalomban, mert kötve hiszem, hogy én találtam volna fel a spanyolviaszkot.)

mintakor_gyurufelezes.jpg

Aztán csináltam egy negyedik eljárást, amiben, ha nem ismerjük a körön kívüli első fát, a körön belüli két legtávolabbi fa közti gyűrűt felező sugarat szoroztam fel n*(n-1)-gyel, azaz az egy fára eső átlagos gyűrű területét használtam. Az "átlagos gyűrű" nevet nyerte.

mintakor_atlagos_gyuru.jpg

komment

2015.06.11. 14:32

Lásd még: algoritmus FNM

a Fadgyas-képlet torzításai #1

Körös mintavételnél a mintába kerülés valószínűsége csak a középponttól mért távolságtól függ, azaz ebből a szempontból a mintakör leegyszerűsíthető egy olyan ábrára, ami egyetlen egyenesen (félszakaszon), a középponttól kifelé indulva csak a fák távolságát mutatja. Nagy átlagban a fák egymás után egyre sűrűbben lépnek be, mert minden egyes fával egy gyűrű adódik hozzá a mintakörhöz, és ha a fák síkban vett, kétdimenziós XY-eloszlása (vagy három dimenziós, ha a terep nem sík, és bonyolítani akarom); tehát ha a fák kb. egyforma területet foglalnak el a mintakörben, akkor ezek a gyűrűk kb. egyforma területűek.

Az ábra tehát skálázható a fák középponttól mért távolságával is, ekkor kifelé haladva egyre sűrűbb vonalakat kapunk; és skálázható a belépő terület arányában is, ekkor a vonalak (a fák) nagyjából egyenletesen lépnek be.
Ezt megnéztem a gyakorlatban, írtam egy programot, ami lerajzolja így egy dimenzióban a mintaköröket, és pár százat átnéztem. A vonalkód-olvasó a SPAR-ban érezheti magát így.

(Az egyenletesség valószínűleg igazolható lenne az egyes fákhoz tartozó gyűrűk területének eloszlásainak vizsgálatával is.)

Példának csatoltam egy mintakör egy-egy ábráját. A függőleges tengelyen az adott fa fakészlete van, de ez most nem érdekes, csak a vonalak egymáshoz képest vett távolsága számít.

egydimenzios_mintakor_sugar_c3p1_v02_300.jpg

egydimenzios_mintakor_gyuruterulet_c3p1_v02_300.jpg

komment

2015.06.11. 14:21

Lásd még: algoritmus FNM Király prof HFTT

a Fadgyas-képlet

A helyi fatermési táblás projekt (HFTT) miatt kezdtem el ismét körös mintavételeket nézegetni.

Miután az egyesfák térfogatszámítására használt Király-képlet több generációt ért meg (Veperdi Gábor sokat dolgozott vele és javított a kiindulási paramétereken); továbbá a szabályostól eltérő törzseket (törött, nem élő stb.) is figyelembe veszi a FNM-módszertan, a szisztematikus erdőleltárban az élőfakészlet meghatározásában az igazi játék a mintakörök területének számításában van.

Az FNM-ben a Fadgyas-féle képletet használjuk a mintakör területének meghatározására (a szájhagyomány miatt nevezem így, írott forrásokat sajnos nem ismerek a bevezetés körüli szakmai megfontolásokról), ami a kör középpontjától legtávolabb eső fa sugarából számított kör területét módosítja azon elképzelés alapján, hogy a legkülső fa csak félig tartozik a mintakörbe, és az így n-0,5 db fára levezetett átlagos területet szorozza fel n db fára.

Az FNM-ben 15-25 darab fát vettek fel minden trakton (= mintakör), és ehhez számolták utólag a mintaterület sugarát. A mintakörön felvett egyedek száma az adott állományszerkezethez igazodott, sűrűbb vagy fiatalabb állományokban kisebb lett a kör, szellősebb és idősebb erdőkben nagyobb. Tehát egy változó sugarú és változó törzsszámot megmintázó próbáról van szó.

A Fadgyas-képlet abból indul ki, hogy a mintakörben a középponttól vett legtávolabbi fa csak félig tartozik a mintakörhöz. Azaz félig benne van, a másik fele meg nincs benne. De a fél fával nehéz dolgozni a számításokban, és néhány paraméter esetén értelmezési problémát is okoz (lásd pl. az elegyarány számítása), ezért a mintakör területét módosították úgy, hogy az egy fára eső átlagos terület ne változzon.

Valószínű, hogy a Fadgyas-képlet külföldön is alkalmazott megoldás, valószínűleg nem így nevezik, de itthon Fadgyas Kálmán nevéhez köti a szájhagyomány, mert ő javasolta a bevezetését.)

A Fadgyas-képlet: az FNM-mintaterületek területszámításának képlete, amiben a törzsszám per törzsszám minusz féllel korrigálunk:

T = Pi*t^2*n/(n-0.5)

Ahol:
t = a legtávolabbi fa távolsága a középponttól
n = a mintakör faegyedeinek száma
Ebből számítható vissza a Fadgyas-féle sugár.

Az egy fára eső átlagos terület:

a = A/n

Ahol:
A = a legtávolabbi fa távolságával számított kör területe
A = Pi*t^2

Ha a legtávolabbi fa csak félig tartozik a mintakörhöz:

a = A/(n-0.5)

Ekkor a mintakör területe:

T = n*A/(n-0.5) = n*Pi*t^2/(n-0.5)

És ebből átrendezéssel (... hát még nem is átrendezés, hanem az argumentumok sorrendje változik csak) következik a képlet.

komment

2015.06.11. 08:21

Lásd még: színes megmondás prognózis

a prognózisok befogadási esztétikájáról

60 seconds after releasing the high and low estimates, people forgot there were low estimates. In future, what he would do is run thousands of simulations, not two, and report the average and distribution rather than the high and low.

(Dave Evans, a World Bank tisztviselője egy konferencián az eboláról, pontosabban annak gazdasági hatásáról via Chris Blattman)

Erről Szépszó Gabriella kolléganő ugrott be, aki az OMSZ-nél klímamodelleket futtat, és pár év alatt nekik is az lett a véleményük, hogy a bizonytalanságok kezelésére sok futás statisztikai átlagát-eloszlását kell eredményként interpretálni.

komment

2015.04.11. 06:57

Lásd még: algoritmus

Student-t alkalmazás

Éjszaka Student-t eloszlást táblázatot gyártottam adatbázis-alapú felhasználásra, de nem túl okosan és nem is túl gyorsan.

Azért lenne jó, mert egyszerű konfidencia-intervallum-számításokhoz nem kellene exportot csinálni, betölteni egy olyan szoftverbe, ami tudja kezelni a Student-t táblázatot (pl. statisztikai programcsomag), vacakolni vele.

Az eloszlásnak az a baja, hogy nagyon lapos a vége, és mondjuk 3 jegy pontosságig számolva 100-as szabadságfok felett már elég ritka benne a változás. A közkézen forgó táblázatok általában 120-as szabadságfokig adják meg az értékeit, és a végtelenben. Ezért egy jól használható Student-t kikereső algoritmus alá azokat a sorokat kell összeszedni, ahol nem azonos az értéke az eggyel korábbival. Pepecs munka. Ráadásul excelből, excellel számoltattam az eloszlás értékeit és kézzel töröltem a sok azonos sort. Ahh.

Fura eloszlás egyébként, végtelen nagy szabadságfoknál van egy határértéke, de azt (3 tizedes jegyig) elég össze-vissza szabadságfoknál éri el. Még az a szerencse, hogy monoton.

Le kellene gyártani STATISTICA-ban vagy MathLab-ben a táblázatot és azt szűrni programból, nem? De. És akkor már 4 tizedes jegyig.

komment

2015.04.02. 11:41

Lásd még: algoritmus HFTT erdészeti tájak

nagyléptékű termőhelyi indikáció #4

Pödör Zoltánnal (matematikus) egyeztetve, aki volt szíves kisegíteni a terminológiai útvesztőben, lett neve a gyereknek. Köszönöm.

"Még annyi megjegyzés a "segítsenek elhelyezni ezt a konkrét módszert az osztályozásoknak abban a tengerében, amit adatokkal csinálni lehet" mondathoz [amivel megkerestem - walden], hogy az szokták mondani az adatbányászatban, hogy minden speciális adathalmazhoz ki lehet találni olyan algoritmust, ami az adott adathalmazon jól teljesít, de máson nem. Ezzel csak azt szeretném mondani, hogy egyáltalán nem biztos, hogy ezt a speciális módszert konkrétan ebben a formában bárki is használta már. Bár, ahogy fentebb írtam, az alapja egyértelműen a prototípus-alapú klaszterezés és a keverék modellek." - írta PZ.

Az általam blank sheetről fejlesztett osztályozási eljárást tehát a prototípus-alapú osztályozások közé kell sorolni.

A klaszterezéseknél szokásos távolságfüggvény, ami két elem viszonyát írja le, na ez nem volt igazán, mert a variancia változását közvetlenül teszteltem. Vagy hát a varianciák alapján számolt, a mag+csoport és az új belépő tájrészlet viszonyára felírható a távolság-függvény, ha akarom.

Csak egy osztályozandó változó volt (ftk), tehát nem volt keverék modell sem (nem volt mit keverni).

komment

2015.03.30. 13:38

Lásd még: algoritmus fatermési tábla HFTT erdészeti tájak

nagyléptékű termőhelyi indikáció #3

Az osztályozást tehát jó lett volna megoldani automatizálva. Ehhez nem találtam megfelelő klaszterezési eljárást az általam ismert szoftverekben és a rendelkezésre álló pár nap alatt. Olyan osztályozási eljárást, ami:

  • eleve létező csoportokat (elemi erdészeti tájrészleteket) tud osztályozni, azaz eloszlásokat osztályoz;
  • elválasztja őket az átlagaik alapján;
  • kis számú csoportot képez (2-3-4 darabot).

Biztos van ilyen, nem hiszem, hogy a statisztika tudományában fel lehetne találni a spanyolviaszkot, de én pár nap keresgélés után sem találtam ilyet.

Ezért írtam egyet.

A varincia-analízisben a csoportokon belüli és a csoportok közti variancia viszonyát hasonlítják össze. Ezzel mérhető az átlagok eltérése. E csoportosító eljárásban pedig az a cél, hogy olyan csoportokat képezzek, ami minimalizálja a csoportokon belüli variancát és maximalizálja a csoportok közöttit.

A legjobb az lenne (brute force megoldás), ha minden lehetséges 2-3-4 db csoportot eredményező csoportosítási kombinációt meg lehetne vizsgálni, csoporton belüli varianciákat számolni és a legjobbat kiválasztani. De sajnos 92 db erdészeti tájrészletből bődületes számú kombinációban lehet 2-3-4 csoportot képezni, ezért ez nem megoldható.

Olyan megoldást választottam, hogy az algoritmusnak megadtam jellegzetes tájrészleteket, amik egyrészt nagy területűek (a fatermőképesség fafajsori területtel súlyozott varianciája szoros összefüggésben van a területtel, általában a nagy területű tájak dominálnak egy-egy csoportot), másrészt a képzendő csoportokat reprezentálják. Azaz nagy és átlagukban markánsan különböző tájrészleteket választottam ki, 2 vagy 3 darabot. Az algoritmus ezekhez a magokhoz illeszti a többi tájrészletet.

A variancia implicite tartalmazza az ftk-átlagok viszonyait. Annál illesztésnél növekszik a legkevésbé a variancia, ahol az új belépő tájrészlet átlaga a legközelebb van a már létező csoport átlagához, illetve ami kicsi elemszámú.

Tegyük fel, hogy 2db mag van, azaz két csoport képződik.

Az algoritmus az első lépésben hozzápróbálja a magokhoz az összes még be nem sorolt tájrészletet. Minden maghoz kiválasztható az, ami a legkevésbé emeli meg a varianciát a mag-egtáj belső varianciájához képest. Aztán ki kell választani azt a magot, ahol a legkevésbé emelkedett a variancia. Így egy tájrészletet besoroltunk.

A következő lépcsőben van egy 2 elemű csoport és egy 1 elemű. Ezekhez újra hozzápróbálja az összes szabad tájat, mindkét magnál kiválasztja azt, ami a legkevésbé emeli a csoport varianciáját; majd azt a magot, aminél kevésbé emelkedett a variancia.

És ezt így tovább mindaddig, amíg el nem fogy az összes besorolandó tájrészlet.

Kicsit hasonlít a k-means clusteringre, de nem ugyanaz.

Ez az eljárás először a mag körüli kis tájakat gyűjti oda majd, aztán a rizikósabb nagyobb tájak sorsa eldől magától.

Praktikusan akkor jó az osztályozás, ha a képzett csoportok:

  • elég nagyok (terület), hogy kerüljön majd beléjük kellő mennyiségű FNM-mintapont, amivel stabil regressziós modelleket lehet szerkeszteni;
  • az átlagaiknak elég távolnak kell lenniük, hogy a csoportok elváljanak egymástól (szerintem legalább ftk=2 m3/ha/év különbség, az már 1-2 fatermési osztályt jelent a hagyományos, egyenletes osztásközű fatermési tábláknál).

Az osztályozás jóságát a csoportokon belüli és a csoportok közötti variancia viszonyával lehet mérni. Minél nagyobb a csoportok közti variancia, annál szeparáltabbak a csoportok. Minél kisebb ez a szám, annál inkább összemosódnak a csoportok. A csoportok közti variancia általában a sokaság teljes varianciájának 25-30%-át adta: kb. ennyit javít az osztályozás a későbbi eredmények pontosságán [ez nem pont jó kifejezés].

1

KST

Csoportok közti variancia: 34,1%

tájrészlet db

ftk átlag

variancia

terület

 

 

Node 1

13

10,230

145 516,7

42 313,45

 

 

Node 2

45

8,436

201 616,3

27 907,25

 

 

Node 3

34

6,402

133 491,9

50 508,66

 

 

Megj: a középső csoportot el lehet hagyni, az a legkisebb területű.

 

 

 

 

 

 

 

 

 

Csoportok közti variancia: 27,2%

tájrészlet db

ftk átlag

variancia

terület

 

 

Node 1

36

9,660

282 358,5

71 427,54

 

 

Node 2

56

7,053

248 435,9

49 374,12

 

 

Megj: a 3-as besorolás középső csoportjának elhagyásával.

 

 

 

 

 

 

 

2

KTTm

Csoportok közti variancia: 33,2%

tájrészlet db

ftk átlag

variancia

terület

 

 

Node 1

38

13,403

150 906,6

33 185,53

 

 

Node 2

54

10,156

342 599,6

62 321,94

 

 

Megj: 3-as csoportosításnál a leggyengébb csoport (átlag = 7,986) nagyon kis területet adott (2400 ha).

 

 

 

 

 

 

 

3

KTTs

Csoportok közti variancia: 28,6%

tájrészlet db

ftk átlag

variancia

terület

 

 

Node 1

33

11,814

80 576,0

15 697,88

 

 

Node 2

59

8,346

308 169,1

74 425,38

 

 

Megj: 3 csoportnál a legjobb (átlag = 13,568) nagyon kis területet adott (4800 ha).

 

 

 

 

 

 

 

5

CSm

Csoportok közti variancia: 35,8%

tájrészlet db

ftk átlag

variancia

terület

 

 

Node 1

36

9,599

63 110,1

34 913,51

 

 

Node 2

55

7,394

138 664,7

68 444,55

 

 

Megj: 3 csoportnál nem volt túl nagy különbség a két rosszabb közt (8,866 - 7,226).

 

 

 

 

 

 

 

6

CSs

Csoportok közti variancia: 26,7%

tájrészlet db

ftk átlag

variancia

terület

 

 

Node 1

34

7,872

30 849,7

12 740,66

 

 

Node 2

40

5,587

112 182,3

45 545,19

 

 

Megj: Nem érdemes harmadik csoportot csinálni, csak 1000 ha tervezett terület jutna a legjobbak közé.

 

 

 

 

 

 

 

7

B

Csoportok közti variancia: 24,1%

tájrészlet db

ftk átlag

variancia

terület

 

 

Node 1

29

10,647

62 448,0

25 470,95

 

 

Node 2

33

8,625

167 185,1

60 070,77

 

 

 

 

 

 

 

8

GY

Csoportok közti variancia: 44,1%

tájrészlet db

ftk átlag

variancia

terület

 

 

Node 1

12

7,049

45 831,3

14 016,17

 

 

Node 2

44

4,674

85 626,9

33 491,86

 

 

Node 3

32

2,874

150 208,2

60 847,91

 

 

Megj: itt pont nem vártam volna, hogy érdemes 3 csoport csinálni, de szeparálódik.

 

 

 

 

 

 

 

 

 

Csoportok közti variancia: 34,8%

tájrészlet db

ftk átlag

variancia

terület

 

 

Node 1

34

6,042

113 372,1

29 724,89

 

 

Node 2

54

3,187

215 133,7

78 631,05

 

 

Megj: A középső csoport elhagyásával.

 

 

 

 

 

 

 

 

 

 

9

Am

Csoportok közti variancia: 21,6%

Tájrészlet db

ftk átlag

variancia

terület

 

 

Node 1

34

11,667

259 017,9

23 531,41

 

 

Node 2

58

8,221

335 232,0

33 152,08

 

 

 

 

 

 

 

10

As

Csoportok közti variancia: 27,2%

Tájrészlet db

ftk átlag

variancia

terület

 

 

Node 1

34

11,912

612 087,8

53 270,63

 

 

Node 2

58

7,993

772 835,5

92 036,27

 

 

 

 

 

 

 

13

HNY

Csoportok közti variancia: 26,0%

tájrészlet db

ftk átlag

variancia

terület

 

 

Node 1

21

13,374

141 061,7

12 723,11

 

 

Node 2

71

9,339

230 643,3

21 562,62

 

 

 

 

 

 

 

15

Csoportok közti variancia: 10,9%

Tájrészlet db

ftk átlag

variancia

terület

 

 

Node 1

21

9,248

76703,2

19537,74

 

 

Node 2

65

7,688

73306,9

12349,13

 

 

Megj: nem érdemes csoportokat csinálni, nincs számottevő variancia a csoportok közt (10,9%).

 

 

 

 

 

 

 

17

EF

Csoportok közti variancia: 19,1%

tájrészlet db

ftk átlag

variancia

terület

 

 

Node 1

22

9,465

62 360,1

38 426,23

 

 

Node 2

69

8,166

94 932,4

51 453,13

 

 

Megj: ez a leggyengébben elváló csoportosítás, kicsi a különbség a két átlag között, nem vagyok biztos benne, hogy egyáltalán érdemes-e csoportokat képezni. Nem, nem érdemes.

 

 

 

 

 

 

 

18

FF

Csoportok közti variancia: 9,7%

tájrészlet db

ftk átlag

variancia

terület

 

 

Node 1

43

7,618

9187,3

4091,41

 

 

Node 2

46

5,999

80431,9

36346,84

 

 

Megj: nem érdemes csoportokat csinálni, nincs számottevő variancia a csoportok közt (9,7%).

 

 

 

 

 

 

 

833

EH

Megj: a terület és a variancia fele 531-ben (Nyugat-Zselic) van. A maradék ugyan gyengébb, mint a Nyugat-Zselic, de egyenként valószínűleg kevés mintapontot adnának. Nem érdemes csoportokat képezni.

 

 

 

 

 

 

 

631

MK

Csoportok közti variancia: 22,4%

tájrészlet db

ftk átlag

variancia

terület

 

 

Node 1

47

13,711

36 412,4

5 738,48

 

 

Node 2

44

10,621

90 138,0

11 501,62

 

 

Megj: le lehetne leválasztani a jobb termőhelyeket, de összesen 17ezer ha-ról van szó, tehát kevéssé valószínű, hogy lesz a kis csoportokhoz megfelelő számú mintapont. Nem érdemes csoportokat képezni.

Czirok István kolléga szakmai tapasztalatai és az előzetes hisztogramok alapján készített egy két csoportos (jobb-gyengébb) osztályozást az Akác mag táblára. Ezt kíváncsiságból összevetettem az algoritmikus eredménnyel. 92 tájrészletből 81 esetében azonos besorolásra jutottunk. A 11 darab eltérés a teljes vizsgálati anyag (a 2005-2014 közt átvezetett erdőtervek) fafajsori területének 4,6%-a. Sikerélmény. További önbizalomra ad okot.

Térképeken ábrázoltuk (Magyar Zsolt tette) a kialakult csoportosítást, és meglepően egybefüggő tömböket adott, és ami ki is válik a tömbökből, az indokolhatóan válik ki (pl. az árterek). Azt hittem, sokkal mozaikosabb lesz.

ftk-terkep_09_am_800_1.jpg

Szerintem többször az van, hogy amikor egy általában jó termőhelyekben gazdag tájon egy fafaj/fafajcsoport gyengébb eredményeket ad, ott általában a konkrétan jó részletekben az értékesebb fafajok vannak, és csak a gyengébb részletekben a betelepített faj (akác esetében volt ez a benyomásom).

komment

2015.03.30. 13:29

Lásd még: fatermési tábla HFTT erdészeti tájak fatermőképesség

nagyléptékű termőhelyi indikáció #2

A földrajzi lehatárolás szerintem jól levezethető és alátámasztható egzakt módon is: a nagytájaknál kisebb kiindulási területegységek faállományainak fatermőképesség szerinti eloszlásait csoportosítva kettő (jobb-gyengébb) vagy három kategóriába (jó-közepes-gyenge), esetleg még több csoportba.

A cél az, hogy fatermőképességre nézve minél homogénebb, és a természetben is létező csoportokat képezzünk, ami azzal az előnnyel is jár, hogy az ezekre illesztett regressziók jobb statisztikai paraméterekkel fognak adni. Ftk-ra homogén csoportokat létrehozni úgy, hogy elegendő mintapont maradjon bennük a fatermési táblák készítéshez. Aztán megnézni ezeket térképen.

A kiindulási területegységek lehetnek pl. a községek (kb. 3200 db), az erdőtervezési körzetek (~150db) és az erdészeti tájak (elemi erdészeti tájból, azaz tájrészletből 92 db van), majd ezeket kell nagyobb csoportokba sorolni. A választás végül az erdészeti tájakra esett: kezelhető számuk, határaik időbeli állandósága miatt, és nem utolsósorban azért, mert egyéb gazdálkodási viszonyokat (erdőnevelési hagyományok, növényföldrajzi viszonyok stb.) is leírnak. A szomszédos tájrészletek nagyon különböző termőhelyek lehetnek, pl. Alsó- és Felső Kemeneshát, ezek elválasztása, külön csoportba sorolása az egyik cél.

Az első elgondolás az volt, hogy előállítom a fentihez hasonló hisztogramokat erdészeti tájrészletenként, készülő táblánként maximum 92 darabot, és szakmai megítélés kérdése lesz az, hogy a leíró statisztikák alapján (átlag, medián, szórás, non-outlier terjedelem stb.) az egyes tájrészletek a jobb, a közepes vagy a gyengébb kategóriába tartoznak-e majd. A válogatást egyenként kellett volna elvégezni és jobbra-balra húzogatva osztályozni a hisztogramokat, ami táblánként 50-90 döntést jelentett volna, illetve egy-egy készülő fatermési tábla esetén a növekedési viszonyok áttekintését, rendszerezését stb.

ftk_hist_v08_09_030_crop.png

Az erdészeti tájak ftk-átlagai nagyság szerint sorba rendezve az alábbi ábrákat adják. Ezek alapján nagyjából képet lehetett kapni a csoportosítás lehetőségeiről. Az általános megállapítás az, hogy az állományok zöme hasonló karakterű, az átlagok konfidencia-intervallumai átfednek, az átmenet folytonos és nincsenek jellegzetes, nagy ugrások a termőhelyek között. A két végén a legjobb és/vagy a legrosszabb tájakat lehet leválasztani külön csoportként.

ftk_range-plot_v02_09_crop.jpg

Gyakori, hogy egy-egy képzendő csoportot egy-egy, az adott faj elterjedésére jellemző, hangsúlyos táj ural, tehát a csoportokat ezek köré lehet rendezni.

ftk-terulet_kumulativ_09_crop.png

 

komment

2015.03.30. 13:16

Lásd még: FNM Király prof fatermési tábla HFTT erdészeti tájak fatermőképesség

nagyléptékű termőhelyi indikáció #1

Helyi fatermési táblák (HFTT) készítésébe fogott az intézmény [pátosz]. A táblák alapvetően az FNM 1993-2007 között felvett mintaterületeinek adataira épülnek.

A helyi fatermési táblák (HFTT) készítésekor az első kísérlet a helyi jelleg megragadására az erdészeti nagytájak szerinti beosztás volt, azaz a táblák vonatkozási területe egy-egy nagytáj lett volna. A nagytájakból 6db van, ami nagy elterjedésű fafajok esetében ugyanennyi helyi táblát jelentene, de nem volt előre látható és igazolható, hogy ezek jellegükben, a növekedésmenetek (kor-magasság) lefutásában, a termőhely jóságában valódi különbségeket írnának le.

Czirok István vetette fel, hogy nem a nagytájakat kellene a lokalizáció alapjává tenni, hanem kevesebb (2-3 db) táblát készíteni a jobb és kevésbé jobb termőhelyekre. Utóbbi felvetés (ti. hogy 2-3 db tábla készüljön fafajonként) egybevág a magyar faterméstan aranykorából származó megállapításokkal (pl. Király kandidátusi), miszerint kevés esetben indokolt országos fatermési tábla helyett helyi táblákat készíteni – hiszen az állományok fatermőképesség-eloszlása (ftk) nem annyira széles és változatos.

A fatermőképességre azért esett a választás, mert ez a mutató írja le az állományok növekedési erélyét. Gondolkoztunk még a magasság-adatok és a növedék felhasználásában is, de a fatermőképesség egyetlen számban jellemzi azt, amit a magasság csak a korral összefüggésben ír le.

A nagytájak egyszerű összevonása azonban továbbra sem írna le valódi különbségeket.

A nagytájak faállományainak fatermőképesség szerinti eloszlása gyakran mutat nagy átfedéseket, főleg széles elterjedésű, nagy toleranciájú fajoknál, azaz az egyes nagytájak alig megkülönböztethetők egymástól. Másrészt előfordulnak kifejezetten kétcsúcsú eloszlások is, amik valószínűleg két elváló statisztikai populációt jelentenek. (Lásd Akác mag, Nyugat-Dunántúl).

ftk_hist_nt_v01_09_1-6_600x675_felirat.jpg

A projektben az adattári adatok közül mindenhol a 2005-2014 közti erdőtervezési felvételek anyagait használtuk, mert ezek elvileg a tervező által közvetlenül az állományok megfigyelésével, mérésével nyert adatok és mentesek a növedékesítés esetleges torzításaitól.

A magyar igazgatási nyilvántartások 163 fafajt tartanak nyilván, de ezek közül csak a jelentősebbekre készültek fatermési táblák, összesen 20 darabra. A maradék 143 fafajt valamelyik táblához soroljuk a 20 közül. A hisztogramoknál itt és később is az egyes fafajcsoportok alatt az egyes fatermési táblákhoz sorolt fafajok együttesét értem. Kivételt képeznek a magaskőris (631) és az ezüsthárs (833) fajok, melyekre a projektben külön helyi táblákat terveztünk.

komment

2015.03.26. 15:34

Lásd még: így FNM fatermési tábla HFTT

adat és koncepció

"[a szisztematikus leltár felméréseiben] nincsenek meg azok a definíciók [nem vezethetők le, nem evidensen vezethetők le], amik alapján a fatermési tábla működik: felsőmagasság és 100%-os sűrűség" - mondtam Dr. Gál Jánosnak egy helyütt. "Nem önthetők adatba."

(A megfogalmazásra vagyok büszke, ahh.)

komment

2015.03.08. 14:16

Lásd még: megmondás Adattár

a faállományok kora, mint adat

Hihetetlenül sok információ vész el az állományok korára vonatkozóan, az erdőleírás durván szegényesebb, mint feltehetően az erdő a maga valóságban.

Mesterséges felújításban a szaporítóanyag korának bizonytalansága csak 1-2 év (milyen csemete?), és a végvágás- illetve az elsőkivitel éve is könnyebben azonosítható dátum. Rövidebb az átfutási idő is, a befejezés a 2013-as adatok szerint átlagosan 7 év alatt eljő.

A természetes felújításokban azonban évről-évre nyomon kellene követni a felújulás folyamatát, és a felújítási szint záródásának növekedését, az újulat keletkezésének ritmusában a megfelelő belépő korú fafajsorokkal visszaadni - ehelyett általában a felújítás végén egy átlagos korral kerül be az adattári adminisztrációba a fiatal erdő. Egy 10-20 éves fokozatos felújítóvágás alatt 3-4 nagyobb hullám (makktermés, újulatra bontás) egyáltalán nem valószínűtlen a felújítási szintben, de 10-20 év eleve nincs ilyen hosszútávon adminisztrálva.

Az is szerencse, ha az a felügyelő fejezi be, aki elkezdte, és a végén még emlékszik a legfontosabb dátumokra.

Elegyes állományokban, ahol minimum 3 fafajjal kell dolgozni, már 3 generáció jelenléte is meghaladja a maximum 9 leírható fafajsor jelentette korlátot. (A 10-12ik lenne a véghasználat előtti öreg állomány.)

Az E- és F-lapos szoftverek átlagosan 5 évenként cserélődnek le jogszabályi változás vagy informatikai okok miatt, és ezek általában a definíciók, évszámok, ellenőrzési pontok és nyilvántartási szokások változásával járnak, az információ pedig szivárog el a rendszerből.

Czirok Istvánnak igaza van, hogy az adattári kor egy nagyon bizonytalan adat, talán a legbizonytalanabb. Az igazgatás nem gyűjt erről részletes információt, később pedig tervezéskor, mérhető méretek alapján alig lehet reprodukálni a kort.

Ez a bizonytalanság pedig beépül minden korra alapuló faállomány-leírásba, tehát minden fatermési táblás leírás fakészletébe is.

komment

2015.03.08. 14:05

Lásd még: színes megmondás

uszadékfa

Kié az uszadékfa? Mármint amit a folyó kihord árvízkor. Mert a Nati (meg talán a Péter is) olyanból szeretne asztalt csináltatni - kérdezte Miklós.

Hát a tiéd.

Jogilag?

Ez olyan, mint elhagyni az iskolatáskát a villamoson.
Attól még azé, akitől elúszott.
A birtoklás átmenetileg megszűnik, de a tulajdonjog nem.

Az európai vízgyűjtőkben nincs olyan, hogy a terület senkié, tehát a fa is valakié. Ha az adott fadarab valamilyen készletezett erdei termék, tehát a két vége fűrészelve van, akkor valószínűleg az ártéren maradt farakásból sodródott el, amit nem tudtak idejében kivinni onnan. Ha nincs rajta fűrésznyom, akkor csak egyszerűen kifordult a felázott talajból, vagy eleve kidőlt rönk volt, amit elragadott a víz. De az utóbbi esetben is volt tulajdonosa. Akinek szépen meg lehet köszönni, mondjuk egy ima formájában.

Akitől elúszott, az nem szokta keresni (vagy nehezen tudná bizonyítani, hogy az övé), aki meg megtalálja, az hazaviszi.

Szép példája a természetjog és a konstituált szabályrendszer szürke határzónájának.

Gyakorlati szempontból az uszadékfa gyűjtését a gátőrrel kell egyeztetni, merthogy ő a király a parti sávban. Ha olyan asztalosa van a Natinak, aki nem először dolgozik uszadékfából, szóval van tapasztalata, akkor megoldva, akkor csak az orrgazdaság halvány furdalásával és a birtoklás örömteli érzésével kell együtt élni.

Komolyan javaslom az engesztelő áldozatot, a természeti népek így csinálják vadászat után. Ők sem gondolják úgy, hogy a szarvas az övék.

komment

2015.03.08. 13:56

Lásd még: prognózis FNM Agrárklíma 2

a modellezés alapegysége

Kell majd írni korosztálytábla-alapú modellt is, mert az EMMRE-adatokból csak olyat lehet meghajtani. És a jövő mindenképpen a szisztematikus leltáré. De a jelenlegi alkalmazás (AK2) lokalizálható prognózist akar, tehát ezért egy részlet-fafajsor-alapú modell lesz az első.

komment

2015.03.07. 22:01

Lásd még: távérzékelés FNM

IMAGINES-projekt

Volt egy majdnem közös munkánk Illés Gáborral (végül nem lett belőle semmi), ami arról szólt, hogy egy MODIS nevű amerikai műhold infravörös sugárzást mért sokáig, és az adatai hozzáférhetők, térképre tehetők.

Az infravörös tartományban a felszín által elnyelt fény mennyiségéből lehet következtetni a fotoszintetikus aktivitásra, mert a klorofill viszonylag szűk tartományban nyel el. Jó indexek vannak kidolgozva erre.

Ha van egy ilyen görbéd egy egész évre (mondjuk adatok naponta, vagy hetente), akkor le lehet vezetni a vegetáció éves teljesítményét (azaz hogy mennyi napenergiát vett fel a vegetáció a fotoszintézisnél). Azaz erdő esetében közvetve lehet mérni az évenként változó növekedést. Nem csak egy fatermési táblás átlag van, amivel jelenleg számolunk, vagy 10 évenként megmért növedék van, hanem ennek a napi-heti-havi-éves változékonysága van. A fotoszintetikus aktivitás adatait kellene összevetni az FNM-es növedékkel, fatermési táblával stb., és kalibrálni az elnyelési indexek és a felszíni mérések (a növekmény) összefüggését.

Ez az IMAGINES projekt meg nagyon hasonló, csak egy európai műhold, aminek az adataival az OMSZ-ben elkezdtek dolgozni, és az OMSZ-es témagazda most alkalmazási területet keres az eredményeihez.

komment

2015.03.07. 21:54

Lásd még: klímaváltozás prognózis Agrárklíma 2

Agrárklíma 2 modellezési szintek

Az Agrárklíma projektekben (AK1 és AK2) a klímaváltozás hatásainak erdészeti előrejelzése vagyon megcélozva.

Hogy lesz a klímamodellből hozamprognózis?

1. Klímamodell: idő (éves vagy havi bontásban, esetleg még sűrűbben) -> időjárási paraméterek. A klímamodellek a legjobban körbejárt részei a folyamatnak. A meteorológusok évtizedek óta fejlesztenek, és az egyes időjárási változókra specifikált, jól leírt rendszerek állnak rendelkezésre. Ezeket az eredményeket meg lehet venni, az AK1-hez is vették őket az OMSZ-től.

2. Termőhelyi modellek: időjárási paraméterek -> faterméstani változók (mortalitás, ftk, felújítások sikeressége, fafajok potenciális elterjedésének változása stb.). Szerintem ezek a modellek hiányoznak a legjobban. Abból indul ki minden ilyen koncepció, hogy adott helyen a jövőben várható klíma hol található meg jelenleg, vagy hol található olyan termőhely, ami azt a lehető legjobban megközelíti - és ez utóbbinak a vegetációja a megváltozott (megváltozandó) klíma potenciális vegetációja.

3. Erdőállomány-prognózis: faterméstani paraméterek eltolódásai + korosztály-előretolódás + véghasználati rezsimek -> hozamok, fakészlet, CO2-megkötés stb. (Ez az enyém, ezzel fogok dolgozni.)

komment

süti beállítások módosítása