Content extract
					
					HALMAZOK ÉS FÜGGVÉNYEK Székelyhidi László     2  TARTALOM  Tartalom 1 A MATEMATIKA ALAPJAI 1.1 Az axiomatikus módszer                        1.2 Logikai formulák, következtetések                   1.3 Indirekt bizonyı́tás, tétel megfordı́tása                1.4 A halmazelmélet alapjai                        1.5 Műveletek halmazokkal                         3 3 5 8 10 15  2 A SZÁMFOGALOM 23 2.1 A természetes számok                         23 2.2 Műveletek a természetes számok halmazában            25 2.3 A természetes számok rendezése                    29 2.4 Az egész számok                            31 2.5 Az egész számok rendezése                       37 2.6 Az egész számok hatványozása                    38 2.7 A racionális számok                          39 2.8 A racionális számok hatványozása                  46 2.9 A valós számok halmaza                        49 2.10 A valós számok
teljessége                       54 2.11 A valós számok hatványozása                     57 2.12 A valós számok további tulajdonságai                62 2.13 A logaritmus és tulajdonságai                     67 2.14 A komplex számok                           71 2.15 Közepek és egyenlőtlenségek                      80 3 A FÜGGVÉNYTAN ELEMEI 84 3.1 Függvények                               84 3.2 Inverz függvény                             86 3.3 Összetett függvény                           88 3.4 Számosságok                              91 3.5 Valós függvények                            98 3.6 Néhány egyszerű függvény                       101 3.7 Valós függvények alaki tulajdonságai                 104 3.8 Hatványfüggvények                           108 3.9 Polinomok                                111 3.10 Exponenciális függvények                       113 3.11 Logaritmusfüggvények              
          114 3.12 Trigonometrikus függvények                      116 3.13 Inverz trigonometrikus függvények                  123 4 EGYENLETEK, EGYENLŐTLENSÉGEK 128 4.1 Megoldáshalmazok                           128 4.2 Lineáris egyenletek                           131 4.3 Másodfokú egyenletek                         132 4.4 Magasabbfokú egyenletek                       134     TARTALOM  3  4.5 Abszolút értékkel kapcsolatos egyenletek               137 4.6 Gyökös egyenletek                           140 4.7 Exponenciális egyenletek                        142 4.8 Logaritmusos egyenletek                        143 4.9 Trigonometrikus egyenletek                      145 4.10 Egyenlőtlenségek                            150 4.11 Lineáris egyenlőtlenségek                       151 4.12 Másodfokú egyenlőtlenségek                      152 4.13 Törtes egyenlőtlenségek                        153 4.14 Gyökös egyenlőtlenségek      
                 155 4.15 Exponenciális és logaritmusos egyenlőtlenségek           156 4.16 Trigonometrikus egyenlőtlenségek                   157     4  A matematika alapjai  1  A MATEMATIKA ALAPJAI  1.1  Az axiomatikus módszer  A matematika axiomatikus tudomány, ami azt jelenti, hogy megállapı́tásait nem közvetlenül a környező világ tanulmányozása, kı́sérletezés, induktı́v következtetés révén vonja le, mint a természettudományok általában, hanem deduktı́v úton, bizonyos alapfeltevésekből kiindulva, tisztán logikai módszerekkel. Az induktı́v következtetés azt jelenti, hogy nagyszámú konkrét példa közös egyedi tulajdonságából a példák által reprezentált elvont fogalom általános tulajdonságára következtetünk, mı́g a deduktı́v következtetés alkalmazásakor egy elvont fogalom általános tulajdonságából logikai úton következtetünk egy másik, vele
logikai kapcsolatban álló elvont fogalom általános tulajdonságára. A matematikát elsősorban ez a módszertani különbség választja el a természettudományoktól, s egyben ennek a sajátos módszernek köszönhető a matematika rendkı́vüli alkalmazhatósága a természettudományokban. Természetesen a matematikában használatos alapfeltevések valamilyen tapasztalat alapján alakultak ki, valamiféle ”matematikusi közmegegyezés” révén. Ettől a közmegegyezéstől nyilván el lehet térni, s ki lehet alakı́tani olyan logikailag koherens rendszereket, amelyek alapfeltevéseit nem befolyásolja semmilyen tapasztalati tényező, ám várhatóan az ilyen ”elméleteknek” semmilyen értelmes alkalmazása nem lesz és senkit nem fognak érdekelni kiagyalójukon kı́vül. Mégis, a matematikában rendkı́vül óvatosan kell bánni az ”alkalmazás” kifejezéssel, azt semmiképpen sem szabad
valamilyen gyári berendezés alkalmazásával, vagy valamilyen azonnal hasznot hajtó újı́tás felhasználásával összekeverni. A matematikai értelemben vett ”alkalmazhatóság” is elsősorban a fent emlı́tett ”matematikusi közmegegyezés” terméke: amit a matematikát magas fokon művelő tudósok széles csoportjai jónak tartanak, az jó. Azon lehet vitatkozni, hogy ez a felfogás helyes, vagy nem, de a jelen kor matematikáját valamelyest ismerők tudják, hogy ez nagyjából ı́gy van. A matematika fogalmak közti logikai kapcsolatok felderı́tésével, azok leı́rásával foglalkozik. A matematika fogalmai két csoportba sorolhatók: vannak definiált fogalmak és alapfogalmak. Egy fogalom definiálása azt jelenti, hogy megmondjuk, hogy ez a fogalom már korábban definiált fogalmakkal milyen logikai kapcsolatban van. Ezek szerint egy új fogalom definiálásához már korábban definiált fogalmakra van
szükség Miután ez a végtelenségig nem folytatható ”visszafelé”, ı́gy érthető, hogy szükség van néhány olyan fogalomra, amelyeket nem definiálunk: ezek az úgynevezett alapfogalmak. Ha az eddig elmondottakat valamilyen konkrét példával akarjuk illusztrálni, akkor gondoljunk arra, hogy valakinek el akarjuk magyarázni röviden és tömören, hogy mi az, hogy ”szék”, ám magyarázatunk során csak olyan fogalmakat használhatunk, amelyeket az illető már ismer. A ”szék” fogalmát nyilván reménytelen volna valamilyen külső jegyek alapján értelmezni, hiszen annyiféle szék létezik a kisszéktől a királyok trónusán át a villamosszékig, hogy ez az út jár-     1.1 Az axiomatikus módszer  5  hatatlannak tűnik. Nyilván hamarabb boldogulunk, ha azt próbáljuk elmagyarázni, hogy mire jó egy szék, s mi az, amire csak a szék jó Természetesen ez sem könnyű, és itt most
kı́sérletet sem teszünk arra, hogy általánosan definiáljuk a ”szék”-et, de arra talán jó ez a példa, hogy érzékeltesse: sokszor nem az a fontos, hogy valami ”micsoda”, hanem az, hogy ”mit lehet vele csinálni”. Különösen hasznos, sőt, nélkülözhetetlen ez az észrevétel a matematika alapfogalmaival kapcsolatban. Az ugyanis első hallásra egy kissé nyugtalanı́tó, hogy az alapfogalmakat nem definiáljuk Akkor hogyan lehetünk biztosak abban, hogy ezek alatt mindenki ugyanazt érti? Nos, azért az alapfogalmakról valamit mondani kell. A matematika alapfogalmait nem definiáljuk, de megmondjuk, hogy mit lehet velük csinálni. Ezek a ”használati utası́tások” az axiómák Az axiómák olyan rövid matematikai állı́tások, amelyek az alapfogalmak tulajdonságait rögzı́tik. Azért az alapfogalmakkal kapcsolatban vannak még zavaró kérdések. Miért kı́nlódunk egyáltalán
bármiféle fogalmak definiálásával, miért nem lehet minden fogalom alapfogalom? A válasz elég egyszerű: nem sokat lehetne kezdeni egy olyan elmélettel, amelyben hemzsegnek a definiálatlan fogalmak, amelyekről csak axiómák sokasága révén van tudomásunk. A matematikusok ösztönösen irtóznak a nagyszámú alapfogalomtól, ezek számát igyekeznek minél alacsonyabban tartani. Ha rengeteg alapfogalom van, akkor rengeteg axiómát kell ezekkel kapcsolatban felállı́tani, amelyeknek egymással is összhangban kell lenni, s ez áttekinthetetlenné teszi az egész elméletet. Szóval, lehetőleg minimális számú alapfogalommal kell dolgozni. Igen ám, de ki dönti el, hogy mik legyenek ezek az alapfogalmak? Ismét a fentiekben emlegetett homályos ”matematikusi közmegegyezés”? Valóban, valami ilyesmiről van szó, ám azért itt fontos szerepe van a célszerűségnek: lehetőleg néhány olyan fogalmat
kell alapfogalomként kezelni, amelyek egymáshoz való viszonya aránylag egyszerűen leı́rható, s amelyekből az elmélet további fogalmai fokozatosan kiépı́thetők. Miután a matematika sem volt mindig deduktı́v tudomány, ı́gy a modern, deduktı́v matematika nyugodtan merı́t a hosszú története során felhalmozódott tapasztalatokból, s azokat a fogalmakat választja alapfogalomnak, amelyek az előtörténet során erre érdemesnek bizonyultak. Tehát a matematikában vannak bizonyos alapfogalmak, melyekből nincs túl sok, ezeket általában nem definiáljuk, hanem a tulajdonságaikat axiómáknak nevezett logikai formulákkal ı́rjuk le. Az alapfogalmakon kı́vül vannak további fogalmak, melyeket ugyancsak logikai formulák segı́tségével különı́tünk el az összes többi fogalomtól, mely ”elkülönı́tési műveletet” definiálásnak nevezzük, az illető logikai formulákat pedig
definı́cióknak. A matematika a legkülönbözőbb fogalmak közti logikai kapcsolatokat ı́rja le ugyancsak logikai formulák segı́tségével, melyeket tételeknek nevezünk. A tételeket a matematikában mindig be kell bizonyı́tani: a bizonyı́tás ugyancsak logikai formulák sorozata, melyben már bebizonyı́tott formulákból vagy axiómákból kiindulva a logikai következtetési szabályok egymás utáni alkalmazásával véges sok lépésben eljutunk a bizonyı́tandó formulához. Ebből a szempontból tehát az axiómák ugyanazt a szerepet játsszák a tételek között, mint az alapfogalmak az összes fogalmak között: az     6  A matematika alapjai  axiómák is tételek, csak nem kell őket bebizonyı́tani. Így érthető, hogy a matematikusoknak akkor nyugodt a lelke, ha nincs sok alapfogalom, mert akkor nem kell sok axióma, tehát nincs sok bebizonyı́tatlan tétel.  1.2  Logikai formulák,
következtetések  A matematika tételei tehát az axiómák logikai következményei. A logikai következtetési szabályokból nincs túl sok, ezekkel már a középiskolai tanulmányok során találkoztunk. A következtetések egyik legáltalánosabb tı́pusa egy ”ha, akkor.” formájú mondat, melyben a ”ha” szó után álló formula az úgynevezett feltétel, az ”akkor” után pedig az állı́tás következik. Formálisan ezt ”ha p, akkor q” alakban ı́rhatjuk le, ahol a p és q helyén valamilyen ”értelmes logikai formula, állı́tás, ı́télet” áll. Ekkor azt szoktuk mondani, hogy p-ből következik q Egy ilyen sémával kapcsolatban azt is mondjuk, hogy p elegendő, vagy elégséges feltétele q-nak, illetve q szükséges feltétele p-nek. Előfordulhat, hogy p elegendő feltétele q-nak, s ugyanakkor q is elegendő feltétele p-nek. Ekkor természetesen p és q kölcsönösen
szükséges feltételei is egymásnak. Ilyenkor azt szoktuk mondani, hogy p szükséges és elegendő feltétele q-nak, de természetesen ekkor ugyanez érvényes fordı́tva is: q is szükséges és elegendő feltétele p-nek. Ebben az esetben tehát p és q kölcsönösen következnek egymásból, másszóval ekvivalensek, egyenértékűek. Ezt úgy is ki lehet fejezni, hogy ”akkor és csak akkor p, ha q”, s ennek a logikai formulának a neve: ekvivalencia. A ”p-ből következik q” következtetést implikációnak nevezzük, melynek p az előtagja, q pedig az utótagja. Az implikációt röviden p⇒q módon jelöljük, mı́g a ”p akkor és csak akkor, ha q” ekvivalencia jele p ⇔ q. Nézzünk egy egyszerű példát az elemi aritmetika köréből. Legyen p az az ı́télet, hogy ”az x pozitı́v egész szám páros”, q az, hogy ”az x pozitı́v egész szám hárommal osztható”, végül r az,
hogy ”az x pozitı́v egész szám hattal osztható”. Vizsgáljuk meg, hogy milyen ”tételek” érvényesek p, q és r között. Mivel minden hattal osztható pozitı́v egész szám páros, ı́gy r ⇒ p, vagyis r-ből következik p : r a p elegendő feltétele. Ez persze azt is jelenti, hogy p az r szükséges feltétele Ugyanezek érvényesek akkor, ha p helyett q-t mondunk, hiszen minden hattal osztható pozitı́v egész szám osztható hárommal. Vezessünk be még egy ı́téletet: legyen s az az ı́télet, hogy ”az x pozitı́v egész szám kettővel osztható”. Ekkor nyilván az előbbi okfejtésben p helyettesı́thető s-el is. Továbbá az is igaz, hogy p ⇒ s, hiszen minden páros pozitı́v egész szám osztható kettővel, vagyis ahhoz, hogy egy pozitı́v egész szám kettővel osztható legyen elegendő az, hogy páros legyen. Ám ez a feltétel szükséges is: ha egy pozitı́v egész szám
kettővel osztható, akkor páros, vagyis s ⇒ p Ez azt jelenti, hogy p és s ekvivalensek, egymás szükséges és elegendő feltételei: egy pozitı́v egész szám akkor és csak akkor     1.2 Logikai formulák, következtetések  7  páros, ha osztható kettővel. Ezt persze úgy is mondhatjuk, hogy egy pozitı́v egész szám akkor és csak akkor osztható kettővel, ha páros. Általában világos, hogy az ekvivalencia szimmetrikus a két állı́tásra nézve: ha p ekvivalens q-val, akkor q ekvivalens p-vel. Az ı́téletekből azonban nem csupán ”ha., akkor” és ”akkor és csak akkor, ha.” tı́pusú kifejezéseket lehet képezni: vannak további egyszerű logikai műveletek. Az egyik ilyen a tagadás: a p tagadása a ”nem p ”, jelben ¬p Ha p ı́télet, akkor ¬p is az, és p tagadásának, vagy negációjának nevezzük. További ı́téleteket képezhetünk az ”és” és a ”vagy” kötőszavak
alkalmazásával: ha p és q ı́téletek, akkor p∧q is az, melyet a p és q konjunkciójának nevezünk, továbbá p ∨ q is az, melyet a p és q diszjunkciójának nevezünk. A konjunkciót szokás ”és”-műveletnek, a diszjunkciót pedig ”vagy”-műveletnek nevezni. Mint fentebb jeleztük, a matematikai tevékenység célja tételek bizonyı́tása, azaz, axiómákból és korábban már bebizonyı́tott tételekből kiindulva logikai következtetések segı́tségével új tételeket levezetni. Ha egy tételt sikerül ı́gy levezetni, akkor azt mondjuk, hogy az illető tétel be van bizonyı́tva, vagy röviden: igaz. Nagyon fontos tudni, hogy ennek az igazságfogalomnak nem sok köze van a filozófiai és egyéb misztikus igazságfogalmakhoz. Amikor valamely matematikai állı́tásra, tételre (az ”állı́tás” szó a ”tétel”, vagy ”ı́télet” szó szinonimája!) azt mondjuk, hogy ”igaz”
akkor csak röviden annyit mondunk, hogy ”be van bizonyı́tva”, semmi többet. Ha egy tételre azt mondjuk, hogy ”hamis”, akkor az azt jelenti, hogy nincs bebizonyı́tva? Szó sincs róla: az, hogy egy tétel ”hamis” annyit jelent, hogy a tagadása be van bizonyı́tva, a tagadása ”igaz”. Azt mondhatjuk tehát, hogy minden ı́télethez hozzá van rendelve egy úgynevezett igazságérték, ami ”igaz”: i, vagy ”hamis”: h Ám ez a hozzárendelés nem teljesen önkényes: az axiómákhoz például ”igaz” van hozzárendelve. Továbbá a fentiekben felsorolt logikai műveletek esetén pontosan meg kell mondani, hogy ha a kiindulási ı́téletek, amelyeket p, q, stb, jelöl, adott igazságértékkel rendelkeznek, akkor mi lesz a művelet eredményeképpen kapott új formulák igazságértéke. Ez tehát egy ”logikai számtan”, melynek meg kell mondanunk a ”számolási szabályait”. Ezeket a számolási
szabályokat értéktáblázatok segı́tségével adhatjuk meg Lássuk például a legegyszerűbb ”művelet”, a tagadás értéktáblázatát:  i h  ¬ h i  A táblázat első oszlopában a p ı́télet lehetséges logikai értékei vannak felsorolva, mellettük, a második oszlopban pedig a megfelelő ¬ p értékek. A következő táblázat a konjunkció értéktáblázata:     8  A matematika alapjai p∧q i h  i i h  h h h  Itt az első oszlop második és harmadik helyén a p, mı́g az első sor második és harmadik helyén a q lehetséges logikai értékei vannak feltüntetve, végül az oszlopok és sorok kereszteződésében a p ∧ q megfelelő értéke. A diszjunkció értéktáblázata hasonló módon értendő: p∨q i h  i i i  h i h  Álljon itt ezek után az implikáció, valamint az ekvivalencia értéktáblázata: p⇒q i h  i i i  h h i  p⇔q i h  i i h  h h i  valamint  Az
implikáció értéktáblázatából egy fontos tényt olvashatunk ki, melyet egy példával világı́tunk meg. Tekintsük a következő matematikai állı́tást: ”Ha háromnak valamely pozitı́v egész kitevőjű hatványa osztható kettővel, akkor annak négyzete −1”. Vajon igaz ez az állı́tás? A felületes szemlélő valószı́nűleg gyorsan rávágja, hogy ez nyilván hamis, hiszen egy pozitı́v egész szám négyzete nem lehet −1. Igen ám, de itt egy implikációról van szó, és nem az a kérdés, hogy annak utótagja igaz-e, hanem az, hogy maga az implikáció igaz-e. Az implikáció előtagja az, hogy ”háromnak valamely pozitı́v egész kitevőjű hatványa osztható kettővel” ami nyilvánvalóan hamis, hiszen a három pozitı́v egész kitevőjű hatványai páratlan számok, amelyek nem oszthatók kettővel. Mármost, ha egy pillantást vetünk az implikáció
értéktáblázatára, akkor láthatjuk, hogy amennyiben az előtag hamis, akkor az implikáció  függetlenül az utótag igazságértékétől  igaz. Így bármennyire hihetetlennek is tűnik, a fenti matematikai állı́tás igaz Úgy szoktuk ezt fogalmazni, hogy ”a hamisból bármi következik” Egy hamis alapvetésből bármilyen következtetés levonható, s maga a következtetés matematikai értelemben helyes lesz  s vajon politikailag ? Természetesen teljesen hasonlóan készı́thetjük el bármely más logikai művelet értéktáblázatát. A negáció egy egyváltozós művelet, a fent tárgyalt további     Indirekt bizonyı́tás, tétel megfordı́tása  9  négy művelet pedig kétváltozós. Egy logikai műveletnek természetesen tetszőleges számú változója lehet, csak az a lényeg, hogy a változók logikai értékei egyértelműen meghatározzák a művelet eredményének
logikai értékét. A fenti értéktáblázatok figyelmes vizsgálatával bizonyos összefüggéseket állapı́thatunk meg, melyek úgynevezett logikai azonosságokat fejeznek ki. Például, a negáció és a diszjunkció értéktáblázata alapján elkészı́thetjük a ¬p∨q ”művelet” alábbi értéktáblázatát: ¬p ∨ q i h  i i i  h h i  Ez a táblázat azonos az implikáció értéktáblázatával, ami azt jelenti, hogy bármi legyen is p és q logikai értéke, p ⇒ q és ¬p ∨ q logikai értéke azonos: ez a két formula ekvivalens. Ezzel bebizonyı́tottuk a következő tételt: (p ⇒ q) ⇔ (¬p ∨ q) .  (1)  Ez a ”tétel” tehát egy logikai azonosságot fejez ki, ami abban mutatkozik meg, hogy a felı́rt logikai formula logikai értéke mindig i, függetlenül a p, q változók logikai értékétől. Az olyan logikai formulát, melyek igazságértéke a benne szereplő változók
logikai értékétől függetlenül, tehát azonosan igaz, tautológiának nevezzük. A tautológia tagadásának, tehát az azonosan hamis formulának is van neve: ellentmondás, vagy paradoxon. Próbáljunk meg a fenti tételben p és q helyére valamilyen értelmes ”hétköznapi” állı́tásokat helyettesı́teni! Jelentse például p azt, hogy ”holnap esik az eső”, q pedig azt, hogy ”holnap meglátogatlak”. Ekkor a p ⇒ q állı́tás azt jelenti, hogy ”ha holnap esik az eső, akkor (holnap) meglátogatlak”, mı́g a ¬p ∨ q jelentése az, hogy ”holnap vagy nem esik az eső, vagy (holnap) meglátogatlak”. Vajon hétköznapi értelemben ugyanazt jelenti ez a két állı́tás? Ha barátomnak az első változatot mondom, akkor utólag egyetlen egy esetben tehet szemrehányást: ha a kérdéses napon esett az eső és én mégsem látogattam meg. Ez természetesen ugyanaz az eset, mint ami a második
változat esetében szemrehányásra adhat okot: a kérdéses napon esett az eső és nem látogattam meg barátomat. Így a két formula ekvivalenciája ”hétköznapilag” azt jelenti, hogy p és q helyére bármilyen ”hétköznapi értelmes” kijelentést helyettesı́tve a két mondat ”hétköznapi értelme” ugyanaz.  1.3  Indirekt bizonyı́tás, tétel megfordı́tása  Készı́tsük most el a ¬q ⇒ ¬p művelet értéktáblázatát! A következőt kapjuk: ¬q ⇒ ¬p i h  i i i  h h i     10  A matematika alapjai  Azt látjuk, hogy ez is megegyezik az előbbi értéktáblázattal, tehát a következő tétel is érvényes: (p ⇒ q) ⇔ (¬q ⇒ ¬p) . (2) A ”ha p, akkor q .   ” formula tehát ekvivalens a ”ha nem q, akkor nem p” formulával. A p-nek és q-nak a fenti jelentéseket tulajdonı́tva ez azt jelenti, hogy a ”ha holnap esik az eső, akkor (holnap) meglátogatlak” pontosan ugyanazt
jelenti, mint az, hogy ”ha holnap nem látogatlak meg, akkor (holnap) nem esik az eső”. Ezzel kapcsolatban érdemes felhı́vni a figyelmet arra a jelenségre, hogy a hétköznapi beszédben sokan sokszor teljesen félreértelmezik a ”ha p, akkor q” alakú mondatok jelentését. Nevezetesen, sokan felületesen azt gondolják, hogy a ”ha p, akkor q” állı́tásból következik a ”ha nem p, akkor nem q”. A fenti példánál maradva, tegyük fel, hogy barátomnak azt mondom, hogy ”ha holnap esik az eső, akkor (holnap) meglátogatlak”. Másnap gyönyörű idő van, esőnek se hı́re, se hamva, s amikor becsengetek barátomhoz, ő meglepettenkényszeredetten fogad, hogy ”De hiszen azt mondtad, hogy.” Ő ugyanis azt gondolta, hogy ha nem esik az eső, akkor viszont nem látogatom meg, ám én arról az esetről semmit nem mondtam, hogy mi lesz akkor, ha nem esik az eső. Így, bár valóban meglepetésszerűen
látogattam meg, semmiképpen nem mondtam ellent előző ı́géretemnek: barátom nyilván azt gondolta, hogy a p ⇒ q formulából következik a ¬p ⇒ ¬q formula, tehát a (p ⇒ q) ⇒ (¬p ⇒ ¬q) formula azonosan igaz, ám az értéktáblázat elkészı́tésével könnyen láthatjuk, hogy ez nem ı́gy van: a formula igazságértéke p = h, q = i választással h, azaz, pontosan a kritikus esetben, amikor nem esik az eső, s én mégis meglátogatom barátomat, az általam mondott dolog igaz, mı́g az általa gondolt hamis. (p ⇒ q) ⇒ (¬p ⇒ ¬q) i h  i i h  h i i  A ”ha p, akkor q .   ” és ”ha nem q, akkor nem p” állı́tások ekvivalenciája az úgynevezett indirekt bizonyı́tási módszer, vagy másszóval az indirekt bizonyı́tás alapja. Ez hétköznapi nyelven úgy fejezhető ki, hogy ha egy ”ha p, akkor q” alakú tételt akarunk igazolni, akkor ezt úgy is megtehetjük, hogy helyette a ”ha nem
q, akkor nem p” tételt igazoljuk, másszóval, feltesszük az állı́tás ellenkezőjét, s ebből levezetjük a feltétel ellenkezőjét. Mivel a feltétel ”fel van téve”, azaz, igazságértéke i, mi pedig az állı́tás tagadásának igazságát feltételezve sikeresen levezettük azt, hogy egyidejűleg a feltétel igazságértéke h, ellentmondást kaptunk, a p ∧ ¬p ı́téletet. Az ellentmondás forrása az állı́tás tagadása igazságának feltételezése volt, tehát az állı́tás tagadása valójában hamis, azaz, az eredeti állı́tás igaz. Az indirekt bizonyı́tási módszert gyakran alkalmazzuk a matematikában Ennek alkalmazásával tudjuk bebizonyı́tani például, hogy végtelen sok prı́mszám van. A bizonyı́táshoz felhasználjuk azt a tételt, hogy minden 1-nél nagyobb pozitı́v egész számnak van prı́mosztója. Tehát a tételünk úgy szól, hogy ”ha p, akkor q”,
s itt p azt jelenti, hogy ”minden 1-nél nagyobb pozitı́v     A halmazelmélet alapjai  11  egész számnak van prı́mosztója”, a q pedig azt, hogy ”végtelen sok prı́mszám van”. A bizonyı́tást indirekt módon végezzük el: tegyük fel, hogy ¬q, vagyis, hogy véges sok prı́mszám van. Szorozzuk ezeket össze, s az eredményhez adjunk hozzá 1-et, ekkor egy 1-nél nagyobb pozitı́v egész számot kaptunk, ami az összes prı́mszámmal elosztva 1 maradékot ad, tehát nincs prı́mosztója, azaz, ¬p érvényes: nem igaz az, hogy ”minden 1-nél nagyobb pozitı́v egész számnak van prı́mosztója”. Bebizonyı́tottuk tehát ¬q ⇒ ¬p-t, azaz, indirekt módon eredeti tételünket. Érdemes megvizsgálni, hogy az alapvető logikai műveleteinkkel, tehát a negációval, konjunkcióval, diszjunkcióval, implikációval, illetve ekvivalenciával kapott új formuláknak mi a tagadása. Könnyen
ellenőrizhetjük a következő tételek érvényességét: (i) ¬(¬p) ⇔ p , (ii) ¬(p ∧ q) ⇔ ¬p ∨ ¬q , (iii) ¬(p ∨ q) ⇔ ¬p ∧ ¬q , (iv) ¬(p ⇒ q) ⇔ p ∧ ¬q , (v) ¬(p ⇔ q) ⇔ (p ∨ q) ∧ (¬p ∨ ¬q) . Az első tétel a ”tagadás tagadása”, melyet a logikailag képzetlen ”filozófusok”  tudatlanságukat leplezendő  mindenféle misztikus tartalommal igyekeztek felruházni. Az első tétel értelme világos: egy állı́tás tagadásának tagadása ekvivalens az eredeti állı́tással. A második és harmadik tétel összefoglaló neve: de Morgan–azonosságok1 . Ezeknek a jelentésén is érdemes egy pillanatra eltöprengni, hiszen azt a hétköznapi beszédben sokszor félreértelmezik. Ha azt mondom, hogy ”szeretem Katit és Évát”, annak nem az a tagadása, hogy se Katit, se Évát nem szeretem, hanem az, hogy kettejük közül az egyiket biztosan nem szeretem, de lehet, hogy
egyikükkel se rokonszenvezem. Ha viszont azt akarom tagadni, hogy ”holnap Debrecenbe vagy Sopronba kell utaznom”, akkor azt kell mondanom, hogy ”holnap se Debrecenbe, se Sopronba nem kell utaznom”. A negyedik és ötödik tétel hétköznapi jelentése kissé körülményesebben magyarázható el, de az értéktáblázatok segı́tségével könnyen ellenőrizhető helyességük.  1.4  A halmazelmélet alapjai  A modern matematika nyelvezetének alapja a halmazelmélet. A halmazelmélet tudományos igényű felépı́tése axiomatikus módon történik, de ennek tárgyalása meghaladja lehetőségeinket. Itt csupán egy olyan elemi, úgynevezett 1 Augustus de Morgan (1806-1871), skót matematikus     12  A matematika alapjai  naiv halmazelmélet alapjait fogjuk vázolni, mely további céljainknak tökéletesen megfelel. A halmazelméletben két alapfogalmat szokás használni. Az egyik alapfogalom a halmaz fogalma Úgy
kell elképzelnünk, hogy az egész világ halmazokból áll. Naiv értelemben halmazok alatt tehát tetszőleges dolgokat kell érteni, ám az axiómák éppen arra szolgálnak, hogy implicit módon körülı́rják: valójában milyen dolgokat tekinthetünk halmaznak. Megjegyezzük, hogy a ”halmaz” szó helyett pusztán a stı́lus élénkı́tése érdekében használhatjuk az összesség, rendszer, család, osztály, stb., szavakat, melyeket a ”halmaz” szó szinonimáinak kell tekinteni. Semmi értelme nincs tehát az olyan mondásoknak, hogy ”A halmaz azonos tulajdonságú dolgok összessége”, stb. A másik alapfogalom az eleme fogalom, vagy hozzá tartozás, amely két halmaz közötti viszonyt fejez ki, s a következőképpen használjuk: ha A és B két halmaz, akkor vagy A eleme B-nek, s ezt a tényt A ∈ B módon juttatjuk kifejezésre, (azt is mondhatjuk, hogy az A halmaz hozzá tartozik a B
halmazhoz), vagy pedig A nem eleme B-nek, melyet A ∈ / B módon jelölünk, s ekkor úgy is fogalmazhatunk, hogy az A halmaz nem tartozik hozzá a B halmazhoz. E két alapfogalom egymáshoz való viszonyát egy axióma tisztázza, mely szerint két halmaz akkor és csak akkor egyenlő, ha ugyanazok az elemeik. Ebben a felfogásban tehát minden halmaz a saját elemeinek összességeként, a hozzá tartozó halmazok együtteseként jellemezhető, tehát minden halmazt egyértelműen meghatároznak az elemei, s egy halmazt akkor tekinthetünk adottnak, ismertnek, ha bármely halmazról egyértelműen eldönthető, hogy hozzá tartozik, vagy nem. Nem szabad azt képzelnünk, hogy egy halmaz elemeinek azon kı́vül van valami közös tulajdonságuk, hogy az adott halmazhoz tartoznak. Tehát egy halmaznak nem csak szı́nek, vagy csak kutyák, vagy csak számok lehetnek az elemei, hanem például a fehér szı́n, az unokatestvérem két
kutyája és a prı́mszámok együttesen egy jól meghatározott halmazt alkotnak, hiszen a világon minden dologról egyértelműen el lehet dönteni, hogy e halmazhoz tartozik, vagy nem. A fent emlı́tett axióma, mely a meghatározottsági axióma nevet viseli, tehát a halmazok elemeik által való meghatározottságát deklarálja, és nem mellékesen a halmazok egyenlőségét is értelmezi. Ugyanis a mondottak szerint két halmaz akkor egyenlő, ha ugyanazok az elemeik. Ha az A halmaz minden eleme egyúttal a B halmaznak is eleme, akkor azt mondjuk, hogy az A halmaz a B halmaz részhalmaza, illetve a B halmaz tartalmazza az A halmazt, s ezt ı́gy jelöljük: A ⊆ B, vagy B ⊇ A. Ha ráadásul a B-nek van olyan eleme, amely nem eleme A-nak, akkor azt mondjuk, hogy A valódi részhalmaza B-nek, illetve a B valódi módon tartalmazza A-t. Ennek jelölésére szokás az A ⊂ B, illetve B ⊃ A szimbólumokat használni. Nyilván
minden halmaz részhalmaza saját magának: A ⊆ A. Az is világos, hogy ha az A, B, C halmazokra A ⊆ B és B ⊆ C teljesül, akkor A ⊆ C is fennáll. Ha az A és B halmazokra A ⊆ B és B ⊆ A teljesül, akkor a meghatározottsági axióma alapján A = B. Gyakorlatilag két halmaz egyenlőségét ennek alapján úgy lehet bebizonyı́tani, hogy megmutatjuk, hogy     1.4 A halmazelmélet alapjai  13  kölcsönösen részhalmazai egymásnak. Ha az A és B halmazok nem egyenlők, akkor ezt ı́gy jelöljük: A 6= B. A halmazelmélet további axiómái  melyeket nem kı́vánunk részletezni  általában bizonyos halmazok létezését garantálják, különböző eljárásokat szolgáltatva arra, hogy már meglévő halmazokból hogyan lehet további halmazokat konstruálni. Az egyik ilyen eljárás azon alapul, hogy egy halmaz elemeire vonatkozó minden értelmes állı́tás meghatározza a halmaz egy
részhalmazát: azon elemek halmazát, amelyekre az állı́tás igaz. Tisztázni kell azonban, hogy mit értünk ”értelmes állı́tás” alatt. A legegyszerűbb állı́tások x ∈ A, illetve A ⊆ B alakúak, az összes többit ezekből a szokásos logikai műveletek egymás utáni alkalmazásával kapjuk. Ha például A a magyar emberek, B pedig a nők halmazát jelöli, akkor azon x-ek halmaza, melyekre az ”(x ∈ A)∧(x ∈ B)” ı́télet igaz, éppen a magyar nők halmaza. Hasonlóan képezhetünk részhalmazokat a többi fentebb ismertetett logikai művelet felhasználásával, illetve azok kombinációjával. Az ott ismertetett logikai műveletek mellett van azonban még két fontos eljárás, melyekkel adott állı́tásokból új állı́tásokat képezhetünk. Ez a két eljárás az úgynevezett logikai kvantorok, vagy röviden kvantorok alkalmazása. Két logikai kvantor van: az egzisztenciális
kvantor, melynek jele: ∃, és az univerzális kvantor, melynek jele: ∀. Ezeket ”létezik” , illetve ”minden” módon kell kiolvasni; a ”létezik” jel valójában egy fordı́tott E, betű, az angol ”exist” szó kezdőbetűjéből, mı́g a ”minden” jel hasonlóan, az angol ”all” szó kezdő A betűjének megfordı́tásából keletkezett. E kvantorokat úgy kell alkalmazni, hogy a létezik és a minden kifejezéseket csak halmazt jelölő betű követheti, mely után állı́tásnak kell következni. A kvantorok jelentéséhez fell kell tételeznünk egy úgynevezett univerzum rögzı́tését, melyről még az sem biztos, hogy halmaz, de minden szóba jövő halmaz ennek bizonyos értelemben ”eleme”. Ezzel az ”univerzum” nevű képződménnyel rendkı́vül óvatosan kell bánni. Azt gondolhatná az ember, hogy az univerzum biztos az ”összes halmazok halmaza” Ilyen halmaz azonban nem
létezik: mint később látni fogjuk, könnyen be lehet bizonyı́tani, hogy bármely halmazhoz van olyan halmaz, ami annak nem eleme. Egy-egy adott problémával kapcsolatban azt mindig mi mondjuk meg, hogy mi az éppen aktuális ”univerzum”. Ha például egy bizonyos tárgyalás során az univerzum az adott pillanatban élő összes emberek halmaza, továbbá A jelentése a magyar emberek halmaza, akkor a (∃x)(x ∈ / A) állı́tás jelentése: van olyan jelenleg élő ember, aki nem magyar. Ám ha ugyanezt a formulát annak az univerzumnak a felhasználásával alkalmazzuk, amely mondjuk az adott pillanatban a földkerekségen fellelhető összes működőképes rádiókészülék együttese (figyelem: a ”földkerekség”, ”fellelhető”, ”működőképes rádiókészülék” fogalmak definiálandók!), akkor e formula jelentése értelmetlennek tűnhet: létezik a földkerekségen olyan
működőképes rádiókészülék, amely nem magyar ember. Bár e formula különös jelentése látszólag zagyvaság, ám mivel formailag helyes, ezért van logikai értéke. Azt kell mindenekelőtt tisztáznunk, hogy mi egy ilyen ı́télet logikai értéke. Egy (∃x)F (x) logikai formula igazságértéke akkor és csak akkor igaz, ha az előre rögzı́tett univerzumnak van olyan x eleme, melyre az F (x) formula igazságértéke igaz. Ezzel szemben a (∀x)F (x) logikai formula     14  A matematika alapjai  igazságértéke akkor és csak akkor igaz, ha az előre rögzı́tett univerzumnak minden x eleme olyan, hogy az F (x) formula igazságértéke igaz. Tehát  jelen tudásunk szerint,  ha az univerzum a jelen pillanatban élő összes emberek halmaza, akkor a (∃x)(x ∈ / A) állı́tás igaz, mı́g a (∀x)(x ∈ / A) állı́tás hamis. Ha viszont az univerzum jelentése a második példában szereplő
rádiókkal kapcsolatos, akkor feltehetőleg csak rendkı́vül alapos tudományos vizsgálat tudná kiderı́teni az ilyen ı́téletek igazságértékét. Érdemes átgondolnunk, hogy mi a jelentése a (∃x)F (x) és (∀x)F (x) állı́tások tagadásának. Mint tudjuk, a ¬(∃x)F (x) állı́tás definı́ció szerint pontosan akkor igaz, ha (∃x)F (x) hamis, tehát pontosan akkor, ha az univerzum egyetlen elemére sem igaz F (x), azaz, az univerzum minden elemére ¬F Más¡ (x) igaz. ¢ szóval, a ¬(∃x)F (x) állı́tás pontosan akkor igaz, amikor a (∀x) ¬F (x) formula. Ezt ı́gy is ı́rhatjuk: ¡ ¢ ¬(∃x)F (x) ⇔ (∀x) ¬F (x) . Hasonlóan láthatjuk be a következő tétel érvényességét: ¡ ¢ ¬(∀x)F (x) ⇔ (∃x) ¬F (x) . Próbáljuk ki ezeket a tételeket valamilyen hétköznapi példán. Tekintsük a következő mondatot: ”Minden nap Debrecenbe vagy Sopronba utazom” Jelentse a napok halmaza az
univerzumot, d(x) azt, hogy az x napon Debrecenbe utazom, s(x) pedig azt, hogy az x napon Sopronba utazom. Ekkor az előbbi állı́tás az alábbi formulával ı́rható le: ¡ ¢ (∀x) d(x) ∨ s(x) . A fentiek szerint ennek tagadása ¡ ¢ (∃x) ¬d(x) ∧ ¬s(x) , ami azt jelenti, hogy ”Van olyan nap, hogy se Debrecenbe, se Sopronba nem utazom.” Ez nyilván teljesen összhangban van mondanivalónk hétköznapi jelentésével Azonban az egzisztenciális és univerzális kvantorok kombinálásával bonyolultabb példákat is konstruálhatunk. Tekintsük például a következő matematikai állı́tást: ”Van olyan pozitı́v egész szám, hogy minden nála nagyobb egész számnak létezik páratlan prı́mosztója.” Az univerzum legyen a pozitı́v egész számok halmaza, s jelentse p(x) azt, hogy x páratlan prı́mszám. Ekkor az előbbi állı́tás a következő módon formalizálható: £ ¤ (∃x)(∀y) (x < y) ⇒
(∃z)(p(z) ∧ z|y) , ahol a szokásos módon z|y azt jelenti, hogy z osztója y-nak. Ennek az állı́tásnak a tagadása a fentiek alapján a következőképpen formalizálható: az egzisztenciális és az unverzális kvantor tagadásáról mondottak szerint a fenti állı́tás tagadása a következőképpen fog kezdődni: £ ¤ (∀x)(∃y) .   , (3)     1.4 A halmazelmélet alapjai  15  ahol a szögletes zárójelben a pontok helyére az (x < y) ⇒ (∃z)(p(z) ∧ z|y)  (4)  implikáció tagadását kell beı́rnunk. Az implikáció tagadásáról fentebb mondottak szerint a p ⇒ q tagadása p ∧ ¬q, ami esetünkben a következőt jelenti: a (4) tagadása ¡ ¢ (x < y) ∧ (∀z) ¬p(z) ∨ ¬(z|y) , s ezt a (3) formulában a pontok helyére beı́rva kapjuk az eredeti állı́tásunk tagadását: £ ¡ ¢¤ (∀x)(∃y) (x < y) ∧ (∀z) ¬p(z) ∨ ¬(z|y) . (5) Figyelembe véve a fentebb látott (1)
ekvivalenciát, valamint azt a nyilvánvaló tényt, hogy egy ¡ formula mindig ¢ helyettesı́thető egy vele ekvivalenssel, az (5) formulában a ¬p(z) ∨ ¬(z|y) részformula a következő formulával helyettesı́t¡ ¢ hető: (z|y) ⇒ ¬p(z) , ı́gy az (5) formula a következő alakot ölti: £ ¡ ¢¤ (∀x)(∃y) (x < y) ∧ (∀z) (z|y) ⇒ ¬p(z) .  (6)  Ez tehát eredeti állı́tásunk tagadása, amit a következő módon olvashatunk: ”Minden x pozitı́v egész szám esetén van olyan y pozitı́v egész szám, mely x-nél nagyobb, és minden z pozitı́v egész számra igaz az, hogy ha z az y-nak osztója, akkor z nem páratlan prı́mszám.” Ezt valamivel egyszerűbben úgy fogalmazhatjuk, hogy ”Minden pozitı́v egész számnál van olyan nagyobb egész szám, melynek nincs páratlan prı́mosztója.” Ha valakinek az eredeti állı́tás igazságértékével kapcsolatban kétsége merülne fel, akkor
gondoljon arra, hogy a (6) állı́tás pusztán azt jelenti, hogy végtelen sok olyan egész szám van, amelynek csak 2 a prı́mosztója, s ez nyilván igaz, hiszen ilyenek a 2 hatványai. Ezek szerint eredeti állı́tásunk tagadása igaz, vagyis az eredeti állı́tás hamis. Visszatérve mármost a különböző halmazelméleti eljárásokra, melyek segı́tségével adott halmazokból újakat lehet konstruálni, az egyik ilyen, mint emlı́tettük, részhalmazok értelmezéséről szól: adott halmaz és adott értelmes tulajdonság esetén az adott halmaz adott tulajdonságú elemei egy részhalmazt alkotnak, melynek létezését ugyancsak egy axióma biztosı́tja. Ha például P a pozitı́v egész számok halmaza, p(x) pedig az a tulajdonság, hogy az x pozitı́v egész számnak nincs 1-től és x-től különböző osztója, akkor a pozitı́v prı́mszámok halmaza a P halmaz alábbi módon definiált
részhalmaza: ¯ {x ¯(x ∈ P ) ∧ p(x) } . Legyen például S(x) az x ∈ / x állı́tás, és tetszőleges A halmaz esetén legyen B az A halmaznak az S(x) tulajdonságú elemeiből álló részhalmaza, azaz legyen ¯ B = {x¯(x ∈ A) ∧ (x ∈ / x)}. Megmutatjuk, hogy a B nem lehet eleme A-nak Tegyük fel az ellenkezőjét, vagyis legyen B az A-nak eleme. Ha B tetszőleges halmaz, akkor vagy B ∈ B, vagy B ∈ / B teljesül. Az első esetben B ∈ / A teljesülne, ı́gy B nem lehet a B eleme. A második esetben viszont B ∈ / B miatt B ∈ B     16  A matematika alapjai  következik, ami ismét ellentmondás. Így azt kaptuk, hogy a B halmaz nem eleme A-nak, tehát a teljesen tetszőleges A halmaz esetén létezik valami - nevezetesen a B halmaz -, ami nem eleme A-nak. Így nem létezik olyan halmaz, amelynek minden halmaz eleme lenne: az összes halmazok halmaza nem létezik. Ezt azért nagyon lényeges tudni, mert a halmazelmélet
kialakulásának korai szakaszában az összes halmazok halmazának a létezését természetesnek vették, s ez vezetett többek között a Russel 2 -féle paradoxonhoz. Természetesen ahhoz, hogy a részhalmaz-axióma segı́tségével halmazokat gyártsunk, szükség van legalább egy halmazra. A továbbiakban tehát feltételezzük, hogy létezik halmaz Ha ennek az ”x 6= x” tulajdonságú elemeiből álló részhalmazát tekintjük, akkor egy olyan halmazt kapunk, amelynek nincs eleme. Ilyen halmaz csak egy van, hiszen minden halmazt egyértelműen meghatároznak az elemei. Ezt a halmazt üres halmaznak nevezzük, s ∅ módon jelöljük Világos, hogy az üres halmaz minden halmaznak részhalmaza, s az üres halmaznak nincs valódi részhalmaza.  1.5  Műveletek halmazokkal  Az előző szakaszban láttunk példát arra, hogy a részhalmazok képzése milyen módon lehetséges. További halmazok konstrukciója
további axiómák segı́tségével történik A részletek mellőzésével bemutatjuk ezeket a konstrukciókat, az úgynevezett halmazelméleti műveleteket, valamint ezek tulajdonságait. Ha A és B két halmaz, akkor pontosan egy olyan halmaz létezik, melynek A és B eleme, továbbá nincs más eleme. Ezt a halmazt az A és B halmazokból képzett rendezetlen párnak nevezzük. Jele: {A, B} Ha A = B, akkor {A, B} helyett {A}-t ı́runk, s ez a halmaz az A elemből álló egyelemű halmaz. Ennek a halmaznak egyetlen eleme van: az A halmaz. Például {∅} az az egyelemű halmaz, melynek egyetlen eleme az üres halmaz, ı́gy természetesen különbözik ∅-tól, hiszen ez utóbbinak egyáltalán nincs eleme. Ez az eljárás két halmazról több halmazra is kiterjeszthető, és az ı́rásmód is hasonló, tehát egy halmazt megadhatunk elemeinek felsorolásával: a következő lista {A, B, C, D, E} azt a halmazt jelenti,
melynek pontosan a felsorolt halmazok az elemei. Hasonlóan, {1, 2, .   , 99} azt a halmazt jelenti, melynek pontosan a 100-nál kisebb pozitı́v egész számok az elemei. Ezt az eljárást akkor használjuk, ha a felsorolás túl hosszú lenne, de a leı́rt néhány elemből többé-kevésbé egyértelműen következtethetünk a halmaz összes elemeire. Persze, pontosabb lenne, ha a következőt ı́rnánk: ¯ {x¯ x egy 100-nál kisebb pozitı́v egész szám} . 2 Bertrand Russel 1872-1970, angol matematikus     1.5 Műveletek halmazokkal  17  Természetesen a halmaz elemeit definiáló tulajdonságot, vagy szabályt is beı́rhatjuk a kapcsos zárójelbe, mint például a ¯ {x¯ x|100} halmaz esetében, melynek elemei a 100 összes  pozitı́v és negatı́v  osztói. Ha csak a pozitı́v osztók halmazáról van szó, akkor annak jelölése például ¯ {x¯ x|100 és x > 0} lehet. A lényeg az, hogy a felı́rásból
egyértelműen el tudjuk dönteni, hogy mi tartozik a halmazhoz és mi nem. Ha A egy halmaz, akkor azt a halmazt, amelynek elemei az A halmaz S elemeinek elemei, az A halmaz egyesı́tésének, vagy uniójának nevezzük és A módon jelöljük. Formálisan tehát [ ¯ A = {x¯ (∃y)[(y ∈ A) ∧ (x ∈ y)]} . S Tehát egy x pontosan akkor eleme az A halmaznak, ha az A-nak van olyan eleme, melynek az x eleme. Ez természetesen nem jelenti azt, hogy x magának az A halmaznak eleme, de ez is előfordulhat. Ha például A a következő halmaz:  ª A = ∅, {∅} akkor a következő állı́tások mindegyike érvényes: ∅ ∈ A,  ∅ ⊆ A,  ∅ ⊂ A,  ∅∈  [  A.  Valóban, az üres halmaz eleme A-nak, hiszen fel van sorolva az A elemei között. Ugyanakkor az üres halmaz, mint minden halmaznak, az A-nak is részhalmaza. Továbbá nyilván az üres halmaz az A-nak valódi részhalmaza, hiszen A-nak van eleme (kettő is!), az üres
halmaznak pedig nincs. Végül az üres halmaz eleme az A uniójának, hiszen A-nak van olyan eleme, melynek az üres halmaz eleme: ez éppen {∅}, amint az A elemeinek felsorolásából látható. Az előző példa azt mutatja, hogy egy adott problémával kapcsolatban különböző halmazok egyfajta ”hierarchia”, vagy ”ranglétra” különböző fokain jelenhetnek meg: a legfelső szinten vannak azok a halmazok, amelyek az adott probléma szempontjából egyetlen más halmaz elemeként sem szerepelnek. Ugyanezen a legfelső szinten foglalnak helyet azok a halmazok, melyek az előbbieknek részhalmazai. A második szintre kerülnek a legfelső szinten szereplő halmazok elemei, s azok részhalmazai, és ı́gy tovább Természetesen egy adott halmaz különböző problémákban más és más szintekre kerülhet, sőt, az is előfordulhat, hogy egy halmaz egy adott problémában különböző szinteken is megjelenik.
Például a fenti esetben az A halmaz nyilván a legfelső szinten foglal helyet, s ı́gy az üres halmaz, mint az A részhalmaza, ugyancsak megjelenik a legfelső szinten. Ugyanakkor az üres halmaz az A halmaz eleme is, ı́gy a második szinten is     18  A matematika alapjai  helyet foglal. Egy adott probléma leı́rásakor a ranglétra különböző fokain megjelenő halmazokat különböző tı́pusú betűkkel szoktuk jelölni: a legalacsonyabb szinten állókat például az angol ábécé kisbetűivel, az eggyel magasabb szinten állókat a megfelelő nagybetűkkel, s ha problémánkban fellépnek még magasabb ”rangú” halmazok, akkor esetleg ı́rott nagybetűket, gót betűket, stb. alkalmazhatunk Ez természetesen nem kötelező, de adott esetben megkönnyı́theti a leı́rt probléma áttekinthetőségét. Legyenek A, B adott halmazok, s jelölje C e két halmazból képzett rendezetlen pár
egyesı́tését, másszóval, legyen [ C= {A, B} . A C halmaznak egy x halmaz tehát pontosan akkor eleme, ha x az A és B közül valamelyiknek  esetleg mindkettőnek  eleme. A C halmazt tehát az A és B halmazok egyesı́téseként kapjuk, s a ”rendezetlen pár egyesı́tése” elnevezés helyett az A és B egyesı́tése, egyesı́tési halmaza, vagy uniója kifejezések valamelyikét használjuk. A jelölést is módosı́tjuk a következőre: C =A∪B. Ezt a fogalmat és jelölést kettőnél több halmaz esetére is kiterjeszthetjük: ha tehát A1 , A2 , .   , An adott halmazok, akkor a C = A1 ∪ A2 ∪ · · · ∪ An azt a halmazt jelöli, melynek egy x halmaz pontosan akkor eleme, ha van az A1 , A2 , .   , An halmazok között legalább egy, amelynek x eleme A fenti halmazt a    használata nélkül n [ C= Ak k=1  módon is szokás jelölni. Ez azt jelenti, hogy a k, úgynevezett futó index helyére Ak -ban az 1, a 2, a
3, stb. számokat kell behelyettesı́teni n-ig bezárólag, majd az ı́gy kapott A1 , A2 , .   , An halmazok egyesı́tését kell képezni Ezt a jelölést a későbbiekben más műveletekkel kapcsolatban is használni fogjuk. Rátérünk a következő művelet értelmezésére. Ha A egy halmaz, akkor azt a halmazt, amelynek elemei T az A halmaz elemeinek közös elemei, az A halmaz metszetének nevezzük és A módon jelöljük. Formálisan tehát  ¯ A = {x¯ (∀y)[(y ∈ A) ⇒ (x ∈ y)]} . T Tehát egy x pontosan akkor eleme a A halmaznak, ha x az A minden elemének eleme. Legyenek A, B adott halmazok, s jelölje C e két halmazból képzett rendezetlen pár metszetét, másszóval, legyen  C= {A, B} .     1.5 Műveletek halmazokkal  19  A C halmaznak egy x halmaz tehát pontosan akkor eleme, ha x az A-nak is és a B-nek is eleme. A C halmaz tehát az A és B halmazok közös elemeiből áll, s a ”rendezetlen pár
metszete” elnevezés helyett az A és B metszete, vagy közös része kifejezések valamelyikét használjuk. A jelölést is módosı́tjuk a következőre: C =A∩B. A fentiekhez hasonlóan ezt a fogalmat és jelölést is kiterjesztjük kettőnél több halmaz esetére: ha tehát A1 , A2 , .   , An adott halmazok, akkor a C = A1 ∩ A2 ∩ · · · ∩ An azt a halmazt jelöli, melynek egy x halmaz pontosan abban az esetben eleme, ha x az A1 , A2 , .   , An halmazok mindegyikének eleme A fenti halmazt C=  n   Ak  k=1  módon jelölhetjük. Ha A ∩ B = ∅, akkor azt mondjuk, hogy A és B diszjunktak Ha az A halmaz bármely két eleme diszjunkt, akkor azt mondjuk, hogy A elemei páronként diszjunktak. S T S Megjegyezzük, hogy az A és A jelölések mellett használatos az x∈A x, T illetve x∈A x ı́rásmód is. Megjegyezzük továbbá, hogy ebben az összefüggésben szokás A-t halmazrendszernek is nevezni, nyomatékosı́tva
azt a tényt, hogy ezekben a konstrukciókban az A halmaz elemeinek elemeiből alkotunk új halmazt. Most összefoglaljuk a fenti két művelet legfontosabb tulajdonságait. 1.51 Tétel Tetszőleges A, B, C halmazok esetén érvényesek a következő tulajdonságok: A ∪ ∅ = A, A ∪ B = B ∪ A, A ∪ (B ∪ C) = (A ∪ B) ∪ C, A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C), A ∩ A = A,  A ∩ ∅ = ∅; A ∩ B = B ∩ A; A ∩ (B ∩ C) = (A ∩ B) ∩ C; A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C); A ∩ A = A.  Továbbá A ⊆ B akkor és csak akkor, ha A ∪ B = B, A ⊆ B akkor és csak akkor, ha A ∩ B = A. A tétel néhány állı́tásának igazolásával illusztráljuk, hogy egy ilyen tételt miként lehet bebizonyı́tani. Általánosságban előrebocsátjuk, hogy  mint a     20  A matematika alapjai  fentiekben megjegyeztük  két halmaz pontosan akkor egyenlő, ha ugyanazok az elemeik. Másszóval, két halmaz egyenlőségét
úgy lehet bebizonyı́tani, hogy megmutatjuk: a két halmaz kölcsönösen részhalmaza egymásnak. A következő bizonyı́tás során, és a későbbiekben is ezt az elvet fogjuk követni. Bizonyı́tás. Lássuk például a bal oldali oszlopban a negyedik állı́tás bizonyı́tását! Vezessük be a következő jelöléseket: M = A ∪ (B ∩ C) ,  N = (A ∪ B) ∩ (A ∪ C) .  Azt kell tehát igazolnunk, hogy M ⊆ N és N ⊆ M . Először azt mutatjuk meg, hogy M ⊆ N . Ebből a célból tegyük fel, hogy x az M halmaz egy tetszőleges eleme. Ekkor  az M halmaz értelmezése folytán  az x vagy az A halmaznak eleme, vagy a B ∩C halmaznak. Ha az első eset áll fenn, tehát x az A halmaznak eleme, akkor az egyesı́tés definı́ciója miatt eleme az A ∪ B és A ∪ C halmazoknak is, ı́gy a közös rész definı́ciója miatt e két halmaz metszetének is, tehát eleme az N halmaznak, s ezt kellett igazolnunk. Hátra
van azonban a másik eset, amikor x a B ∩ C halmaznak eleme. Ekkor viszont  a metszet értelmezése alapján  x eleme a B halmaznak is, és a C halmaznak is. Következésképpen ekkor x eleme az A ∪ B és A ∪ C halmazok mindegyikének, tehát ezek metszetének is, vagyis ismét azt kaptuk, hogy x eleme az N halmaznak. Mivel x az M halmaz tetszőleges eleme volt, ez az okfejtés az M halmaz minden elemére érvényes, tehát az M halmaz minden eleme az N halmaznak is eleme, ami azt jelenti, hogy az M halmaz részhalmaza az N halmaznak: M ⊆ N . Most az N ⊆ M fordı́tott tartalmazást igazoljuk, hasonló módon. Legyen tehát x az N halmaz egy tetszőleges eleme. Ekkor x eleme az A ∪ B és A ∪ C halmazoknak. Két esetet különböztethetünk meg: ha x eleme az A halmaznak, akkor máris készen vagyunk, hiszen ekkor x eleme az A ∪ (B ∩ C) egyesı́tésnek, vagyis az M halmaznak. Ha viszont x nem eleme az A halmaznak, akkor az A ∪ B
és A ∪ C halmazoknak csak úgy lehet eleme, ha B-nek is és C-nek is eleme. Ez viszont azt jelenti, hogy x eleme B ∩ C-nek is, ı́gy természetesen az A ∪ (B ∩ C) halmaznak is, azaz M -nek, vagyis N ⊆ M teljesül. Ezzel igazoltuk, hogy M = N . A két oszlopban felsorolt állı́tások mindegyike  és általában minden hasonló halmazelméleti azonosság  ugyanilyen módon igazolható, ennek elvégzését az Olvasóra bı́zzuk. Itt még az utolsó két állı́tás közül a másodikat igazoljuk Mivel ”akkor és csak akkor” tı́pusú állı́tásról van szó, valójában a következő két állı́tás ekvivalenciáját kell igazolnunk: p: A⊆B,  q : A ∩ B = A,  ahol A, B tetszőleges halmazok. A p és q ekvivalenciája azt jelenti, hogy p ⇒ q és q ⇒ p egyaránt teljesül. Tegyük fel először, hogy p igaz, tehát fennáll A ⊆ B, s ekkor mutassuk meg, hogy A ∩ B = A. Legyen x az A ∩ B egy
tetszőleges eleme, akkor x eleme A-nak is és B-nek is. Ebből nekünk elég annyi, hogy x     1.5 Műveletek halmazokkal  21  eleme A-nak, tehát megmutattuk, hogy A∩B ⊆ B. Másrészt, ha x az A halmaz egy tetszőleges eleme, akkor a p feltétel miatt x a B-nek is eleme, ı́gy eleme az A és B közös részének, A ∩ B-nek. Vagyis ha p fennáll, akkor A ∩ B = A, tehát fennáll q is, s ezzel a p ⇒ q implikációt bebizonyı́tottuk. A fordı́tott implikáció igazolásához tegyük fel, hogy q igaz, vagyis A ∩ B = A. Ebből nekünk elég annyi, hogy A ⊆ A ∩ B, ez ugyanis azt jelenti, hogy az A tetszőleges x eleme beletartozik A∩B-be, tehát speciálisan B-be, azaz A ⊆ B. Megmutattuk tehát, hogy ha q igaz, akkor p is, vagyis q ⇒ p, s a fent igazolt másik implikációval együtt ez azt jelenti, hogy p ⇔ q, vagyis A ⊆ B akkor és csak akkor áll fenn, ha A ∩ B = A. Természetesen a későbbiekben nem fogunk
minden egyes halmazelméleti azonosságot ilyen aprólékosan levezetni, ám a gyakorlatlan olvasó számára fontos, hogy amı́g megfelelő jártasságra nem tesz szert, addig hasonló részletességgel gondolja végig, esetenként ı́rja is le a bizonyı́tásokat. Megfelelő rutin elsajátı́tása után például az előbbi tétel utolsó részének bizonyı́tását a következő módon intézhetjük el: ha A ⊆ B, akkor A minden eleme B-ben is benne van, ı́gy A ∩ Bben is, vagyis A része A ∩ B-nek. Mivel az A ∩ B ⊆ A tartalmazás bármely két halmazra nyilvánvaló, ı́gy A ⊆ B esetén fennáll A ∩ B = A. Megfordı́tva, ha A ∩ B = A érvényes, akkor nyilván A ⊆ B is, hiszen bármely A, B, C halmazok esetén C ⊆ A ∩ B-ből következik C ⊆ A és C ⊆ B. Most újabb műveletet értelmezünk. Ha A és B halmazok, akkor AB jelöli mindazon elemek halmazát, melyek A-nak elemei, B-nek nem. Az AB
halmazt az A és B különbségének nevezzük. Ha B ⊆ A, akkor AB-t a B halmaz A-ra vonatkozó komplementerének, vagy kiegészı́tő halmazának nevezzük. Egy rögzı́tett X halmaz részhalmazai esetén az X-re vonatkozó komplementert  ha ez nem okoz félreértést  röviden komplementernek nevezzük, s ha A ⊆ X, akkor XA-t Ac jelöli. 1.52 Tétel Legyen X halmaz és A, B ⊆ X Ekkor ∅c = X,  X c = ∅,  (A ∪ B)c = Ac ∩ B c ,  (Ac )c = A,  (A ∩ B)c = Ac ∪ B c .  Bizonyı́tás. A tételben szereplő azonosságok bizonyı́tása ugyanúgy történhet, mint az előző tételben. Itt az utolsót igazoljuk Legyen M = (A∩B)c , N = Ac ∪B c . Ha x az M egy tetszőleges eleme, akkor a komplementer definı́ciója alapján x nem eleme az A ∩ B halmaznak, tehát az A és B közül legalább az egyiknek nem eleme. Ha x az A-nak nem eleme, akkor eleme Ac -nek, s ı́gy Ac ∪ B c -nek is, ha pedig x a B-nek nem eleme, akkor
eleme B c -nek, s ı́gy ismét Ac ∪ B c -nek is. Tehát x mindenképpen eleme Ac ∪ B c -nek, azaz N -nek, vagyis M ⊆ N . Megfordı́tva, ha x az N halmaz egy tetszőleges eleme, akkor x az Ac és B c közül legalább az egyiknek eleme, tehát az A és B közül legalább az egyiknek     22  A matematika alapjai  nem eleme, ı́gy nem eleme A ∩ B-nek, vagyis eleme M -nek. Ezzel tehát azt is igazoltuk, hogy N ⊆ M , amivel a tétel bizonyı́tását befejeztük. A két utolsó egyenlőséget de Morgan-azonosságoknak nevezzük. Nem neheéz felfedezni ezek szellemi rokonságát a korábban ”de Morgan–féle” tételeknek nevezett azonosságokkal. A fentiekben értelmezett egyesı́tés, metszetképzés, különbségképzés és komplementerképzés mellett még szokásos az A és B halmazok szimmetrikus differenciáját is értelmezni a következő módon : A ◦ B = (AB) ∪ (BA). Egy halmaz összes részhalmazai az
ilyen módon értelmezett műveletekkel úgynevezett halmazalgebrát alkotnak. A halmazalgebra az úgynevezett Boole-algebra speciális esete, melyet George Boole3 vezetett be az 1854-ben kiadott ”Introduction to the Laws of Thought” (”Bevezetés a gondolkodás törvényeibe ”) cı́mű könyvében. A halmazalgebrákban további egyszerű azonosságok érvényesek, melyek az 1.51 és 1.52 tételek mintájára fogalmazhatók meg, és igazolhatók Ha adott egy A halmaz, akkor azt a halmazt, melynek elemei az A összes részhalmazai, az A halmaz hatványhalmazának nevezzük. Jele: P(A) Így például P(∅) = {∅}, P({A}) = {∅, {A}}, stb Ismételten felhı́vjuk a figyelmet a ”halmaz eleme” és a ”halmaz részhalmaza” közti alapvető különbségre: ezek általában a ”ranglétra” két különböző fokán foglalnak helyet. Tudjuk, hogy az a halmaz, melynek elemei az A összes elemei, maga az A halmaz, mı́g az
a halmaz, melynek elemei az A összes részhalmazai, éppen az A imént értelmezett hatványhalmaza. A következő fogalom értelmezésével kapcsolatban az a cél, hogy valamilyen értelmes módon beszélhessünk egy halmaz elemeinek sorrendjéről, például első, második, stb., eleméről Ha adottak az A, B, C halmazok, akkor ezek egy lehetséges sorrendje: A C B. Ezt a sorrendet egyértelműen jellemezhetjük az {A}, {A, C}, {A, B, C} halmazokkal. Vegyük észre, hogy ebben a felsorolásban az eredeti sorrend mindegyik helyére azt a halmazt ı́rtuk, melynek elemei az illető helyen, vagy az illető hely előtt álló halmazok. Tehát az imént felsorolt három halmaz közös eleme a sorrendben legelső halmaz: A, majd ezt elhagyva, a maradék közös eleme a sorrendben második halmaz, vagyis C, végül a mindössze egyetlen halmazban szereplő C. A felsorolt három halmazból tehát egyértelműen reprodukálni lehet az
eredeti sorrendet. A három halmaz felsorolásában természetesen a sorrendnek nincs szerepe, hiszen őket egyszerűen az {{A}, {A, C}, {A, B, C}} rendezetlen hármas reprezentálja. Ha ezt a gondolatot a legegyszerűbb esetre alkalmazzuk, amikor csak két halmazt akarunk sorrendbe állı́tani, eljutunk a következő fogalomhoz. Ha A, B halmazok, akkor az {{A}, {A, B}} rendezetlen párt az A és B halmazokból képzett rendezett párnak nevezzük. Jele: (A, B) Az A és B halmazt a rendezett pár első, illetve második komponensének, vagy koordinátájának nevezzük. 3 George Boole 1815-1864, angol matematikus     1.5 Műveletek halmazokkal  23  A következő állı́tás egyszerűen igazolható. 1.53 Tétel Legyenek A, B, C, D halmazok Ekkor (A, B) = (C, D) akkor és csak akkor teljesül, ha A = C és B = D. Az A és B halmazok szorzathalmazának nevezzük a következő halmazt: ¯ A × B = {(a, b)¯ a ∈ A, b ∈ B} . Az A×B
szorzathalmazt szokás Descartes4 -féle szorzathalmaznak is nevezni. Megjegyezzük, hogy kettőnél több halmaz Descartes-féle szorzathalmaza is értelmezhető a rendezett hármas, rendezett négyes, stb., alkalmas definı́ciójával A Descartes-szorzat jelölésére hatvány-jelölést is használunk, ha a tényezők megegyeznek. Így például A×A-t A2 -tel, A×A×A-t A3 -el, stb, jelölhetjük Továbbá, a fentiekben megismert ı́rásmód alkalmazásával az A1 , A2 ,    , An halmazok Descartes–szorzatát n Y Ak k=1  módon is jelölhetjük, melyet ”produktum k egyenlő 1-től n-ig Ak ” módon olvasunk.  4 René Descartes du Peron 1596-1650, francia matematikus-filozófus     24  A számfogalom  2  A SZÁMFOGALOM  2.1  A természetes számok  A számfogalom kialakulása évszázados fejlődés eredménye. Az egész folyamat a számlálással kezdődött, melynek eredményeképpen kialakult a természetes
szám fogalma. A természetes számok valójában véges halmazok elemszámai. ½ ¾  ª  ª Ha az ∅, {∅}, ∅, {∅} , ∅, {∅}, ∅, {∅} , .   halmazok sorozatát figyeljük, akkor a következőt vehetjük észre: a sorozatban minden halmaz úgy keletkezik, hogy képezzük a sorozatban őt megelőző halmazok halmazát. Így az első az üres halmaz, ennek nincs eleme, hiszen ez a sorozat legelső tagja, őt nem előzi meg semmi. A második halmaznak csupán egyetlen eleme van: az üres halmaz, mely a sorozat első eleme A sorozat harmadik tagjának már két eleme van: a sorozat első két tagja. Ezt az eljárást nyilván vég nélkül folytathatjuk, s a kapott halmazsorozat továbbra is rendelkezik ezzel a tulajdonsággal: a sorozat minden tagjának elemei pontosan a sorozat őt megelőző tagjai. Ez a halmazsorozat ”olyan, mint” a természetes számok halmaza. Az a kifejezés, hogy ”olyan, mint” úgy értendő,
hogy intuitı́v módon a természetes számok egymásutánját hasonlóan képzelhetjük el: van egy olyan kezdő tag, amelyet nem előz meg semmi, esetünkben ez az üres halmaz. Továbbá, a sorozat minden tagja után újabb tag következik, hiszen a sorozat vég nélkül folytatható: az eddigi tagokat mindig egy újabb halmaz elemeinek foghatjuk fel, valamint világos, hogy a sorozat különböző tagjai után közvetlenül következő tagok ugyancsak különbözők. Végezetül, hogyan fogalmazhatnánk meg sorozatunknak azt a tulajdonságát, hogy a megadott eljárással a sorozat minden tagjához elérhetünk? Nos, ha a sorozatunknak vesszük egy olyan részhalmazát, amiben az üres halmaz, tehát a kezdő tag fellép, valamint e részhalmaz minden tagjával együtt a sorozatban őt követő tag is szerepel, akkor ez a ”részhalmaz” teljes egészében kiadja a sorozatot. Kiderül, hogy ez a három
tulajdonság valójában jellemzi a természetes számok halmazát: ha egy halmaz ezzel a három tulajdonsággal rendelkezik, akkor az azonosnak tekinthető a természetes számok halmazával. Ez az alapvető észrevétel G. Peano 5 nevéhez fűződik, ennek megfelelően a felsorolt három tulajdonságot Peano–axiómáknak nevezzük Soroljuk fel ezeket mégegyszer, egy kicsit pontosabban. Adott tehát egy N halmaz, melyben értelmezve van a ”rákövetkezés” művelete: a halmaz minden elemének van egy úgynevezett rákövetkezője, ami ugyancsak a halmaz egy eleme Mármost ez a halmaz a ”rákövetkezés” műveletével ellátva eleget tesz a következő feltételeknek: (P1) Van az N halmaznak egyetlen olyan eleme, amely semmilyen N -beli elemnek nem rákövetkezője. Jelölje ezt a különleges elemet o (P2) Különböző elemek rákövetkezői különbözők. 5 Giuseppe Peano 1858-1932, olasz matematikus     2.1
A természetes számok  25  (P3) Ha az N halmaz egy részhalmaza tartalmazza az o-t, és minden elemével együtt annak rákövetkezőjét is, akkor ez a részhalmaz maga N . Láthatjuk, hogy ha a szakasz elején felı́rt halmazsorozatot gondoljuk az N halmaznak, az üres halmazt pedig o-nak, továbbá a ”rákövetkezés” azt jelenti, hogy az összes előző halmazból, mint elemekből készı́tjük a következő halmazt, akkor sorozatunk eleget tesz a Peano–féle axiómáknak. Meg lehet mutatni, hogy minden olyan halmaz, amely alkalmas o-val és ”rákövetkezés”-sel eleget tesz a Peano–féle axiómáknak, lényegében csak elemeinek jelölésében különbözik, tehát azonosı́tható a fentivel. Például a fenti halmazsorozat minden tagját azonosı́thatjuk elemeinek számával: az üres halmazt a 0 számmal, a {∅} halmazt az 1 számmal, és ı́gy tovább. Azonban ne felejtsük el, hogy amikor éppen a
természetes számokat akarjuk értelmezni, akkor még nincs 0, 1, stb Így éppen fordı́tva járunk el: a fenti halmazsorozatnak, vagy bármely más, a Peano–axiómáknak eleget tevő halmaznak a megkülönböztetett elemét nevezzük 0-nak, ennek rákövetkezőjét 1-nek, ennek rákövetkezőjét 2-nek, stb. A természetes számok halmaza tehát bármely olyan halmaz, mely eleget tesz a Peano–axiómáknak. Mindegy melyik ilyen tulajdonságú halmazt vesszük alapul, hiszen fentebb emlı́tettük, hogy a mi szempontunkból ezek egymástól nem különböznek. Mindenesetre elemeit a szokásos módon, a 0, 1, 2, 3    szimbólumokkal jelöljük, a természetes számok halmazát pedig N-el Tehát mostantól o helyett 0-t, ennek rákövetkezője helyett 1-et, ennek rákövetkezője helyett 2-t, stb., ı́runk Azt el kell hinnünk, hogy bebizonyı́tható, miszerint a Peano–axiómák a természetes számok halmazát
félreérthetetlenül és egyértelműen definiálják: minden olyan halmaz, melyben alkalmasan kiválasztott o-val és ”rákövetkezéssel” teljesülnek ezek a tulajdonságok, csupán elemeinek jelölésében különbözik attól, amit mi ezentúl N-el jelölünk Így kell értenünk azt a kijelentést, hogy ezennel definiáltuk ”a” természetes számok halmazát. Arra a kérdésre, hogy ”Mit nevezünk természetes számnak?” a helyes válasz: ”A természetes számok halmazának egy elemét”. A szakasz elején emlı́tett halmazsorozat azt a célt szolgálja, hogy lássuk: van olyan objektum, ami kielégı́ti a Peano–féle axiómarendszert. Előfordulhatna ugyanis, hogy összehordanánk egy csomó tulajdonságot, amelyeket mind elvárnánk a természetes számok halmazától, ám ezeknek csupán az üres halmaz tenne eleget, vagy még az sem. Nyilván fontos azt tudni, hogy az általunk felsorolt
követelményeknek legalább egy valami eleget tesz. Megjegyezzük, hogy a Peano–axiómák közül a harmadik axióma egy rendkı́vül fontos bizonyı́tási módszernek, a teljes indukciónak az alapja. A teljes indukciós bizonyı́tási módszert általában olyan tı́pusú állı́tások igazolására használjuk, hogy ”Minden természetes számra igaz az, hogy ” A módszer abban áll, hogy először megvizsgáljuk, hogy az állı́tás igaz-e a 0 természetes számra. Ez az indukciós bizonyı́tás kezdő lépése. Ha nem, akkor persze állı́tásunk eleve hamis, s próbálkozásunkat befejezhetjük, ha viszont igen, akkor jön az indukciós feltevés: feltételezzük, hogy az állı́tást már bebizonyı́tottuk valamilyen n természetes számra. Ezután befejező lépésként az indukciós feltevést felhasználva az állı́tást     26  A számfogalom  bebizonyı́tjuk a következő természetes
számra, az n rákövetkezőjére. Ha ez sikerül, akkor nyugodtan kijelenthetjük, hogy az állı́tás minden természetes számra igaz. Valóban, ha S jelenti a természetes számoknak azt a részhalmazát, amelynek elemeire az állı́tás igaz, akkor a kezdő lépés alapján S tartalmazza a 0-t, mı́g az indukciós feltevés és a befejező lépés alapján, ha S tartalmazza n-t, akkor tartalmazza az n rákövetkezőjét is. Így a harmadik Peano–axióma alapján S az egész természetes számok halmazával egyenlő, azaz, állı́tásunk minden természetes számra igaz. Előfordulnak olyan matematikai állı́tások, melyek nem minden természetes számra, csak valamely rögzı́tett n0 természetes számmal kezdődően igazak. Az ilyen állı́tások bizonyı́tására is alkalmas a teljes indukció, csak a kezdő lépést kell módosı́tani: először az állı́tást az n0 természetes számra kell
igazolni, majd ezután a többi lépést változatlan formában kell alkalmazni. Lássunk egy egyszerű példát a teljes indukció alkalmazására! Megjegyezzük, hogy most, és a továbbiakban az illusztrációként felhasznált példákban olyan fogalmakat és ismeretanyagot is felhasználunk, melyekről ebben az ı́rásban még nem eshetett szó. Az ilyen esetekben hagyatkozzunk a középiskolás ismeretekre Tehát feladatunk a következő: Bizonyı́tsuk be, hogy három egymást követő természetes szám szorzata mindig osztható 3-mal. Jelölje Kn az n·(n+1)·(n+2) szorzatot, tehát három egymást követő természetes szám szorzatát. Az állı́tás n = 0 esetén azt jelenti, hogy K0 = 0 osztható 3-mal, ami nyilván igaz. Tegyük fel most, hogy Kn osztható 3-mal valamely n természetes szám esetén. Ekkor Kn+1 = (Kn+1 − Kn ) + Kn miatt nyilván elég azt bizonyı́tani, hogy Kn+1 −Kn osztható 3-mal.
Ugyanakkor Kn+1 − Kn = (n + 1) · (n + 2) · (n + 3) − n · (n + 1) · (n + 2) = = (n + 1) · (n + 2) · [(n + 3) − n] = 3 · (n + 1) · (n + 2) , ami nyilvánvalóan osztható hárommal. Ezzel az állı́tást teljes indukcióval bebizonyı́tottuk  2.2  Műveletek a természetes számok halmazában  A természetes számok halmazában ezek szerint már a definı́ció folytán értelmezve van egy művelet, a rákövetkezés művelete. Ez ugyan elég szerény művelet, de kiderül, hogy segı́tségével könnyen értelmezhetünk két komolyabbat is: az összeadás és a szorzás műveleteit. Röviden ismertetjük ezeknek a műveleteknek az értelmezését és legfontosabb tulajdonságaikat. Az összeadás értelmezéséhez a (P3) Peano–axiómát használjuk fel. Ugyanis először azt mondjuk meg, hogy a 0-t hogyan kell hozzáadni egy tetszőleges természetes számhoz, majd pedig azt, hogy ha egy természetes
számot már hozzá     2.2 Műveletek a természetes számok halmazában  27  tudunk adni bármely természetes számhoz, akkor ennek rákövetkezőjével hogy kell megtenni ugyanezt. Világos, hogy ezzel az eljárással a (P3) axióma szerint minden természetes számra értelmezzük az összeadást. Legyen tehát bármely n természetes szám esetén definı́ció szerint n + 0 = n. Ezután tegyük fel, hogy már értelmeztük az m természetes számra bármely n természetes szám esetén az n + m összeadást, másszóval, az n-hez már az m természetes számot hozzá tudjuk adni. Ha most m0 jelöli az m rákövetkezőjét, akkor legyen n + m0 = (n + m)0 . Ez ı́gy teljesen rendben van, hiszen a feltevés szerint n-hez már az m természetes számot hozzá tudjuk adni. A (P3) axióma alapján ezzel bármely két természetes szám összeadását értelmeztük. Nézzük meg röviden ennek az első
látásra talán szokatlannak tűnő definı́ciónak néhány egyszerű következményét. Az első lépés szerint a 0-t bármihez hozzá tudjuk adni. A következő ismeretlen eset az 0 + 1, ahol természetesen 1 a 0 rákövetkezőjét jelenti. A definı́ció szerint azt kapjuk tehát, hogy 0 + 1 = 0 + 00 = (0 + 0)0 = 00 = 1. Továbbmenve, azt kapjuk, hogy általában 0 + m = m teljesül minden m természetes szám esetén. Lépjünk most tovább Honnan tudjuk meg 1 + 1 értékét? A definı́ció szerint 1 + 1 = 1 + 00 = (1 + 0)0 = 10 = 2, ahol felhasználtuk, hogy 1 + 0 = 1 és az 1 rákövetkezőjét 2 jelöli. Általában tehát 1 + n = n0 teljesül minden n természetes szám esetén, azaz, a ”rákövetkezés” az összeadás speciális esete. Hasonlóan kapjuk meg tetszőleges n, m természetes számok esetén azt, hogy az n + m összeg hogyan számı́tható ki a már korábban kiszámı́tott
összegekből. A szorzás definiálásakor hasonlóan járunk el. Először is megmondjuk, hogy 0-val hogyan kell szorozni: legyen definı́ció szerint 0 · n = 0 minden n természetes szám esetén. Ha mármost feltesszük, hogy az m természetes szám olyan, hogy vele már minden n természetes számot meg tudunk szorozni, akkor megmondjuk, hogy ugyanezt hogyan kell megtenni a rákövetkezőjével: legyen m0 ·n = m·n+n. Itt tehát felhasználjuk azt, hogy az összeadást már értelmeztük a természetes számok között, továbbá azt, hogy a feltevés szerint az m-el már minden természetes számot meg tudunk szorozni. Ismét a (P3) axióma miatt ezzel bármely két természetes szám szorzását értelmeztük. Például mi adódik az 1-el való szorzásra? Mivel 1 a 0 rákövetkezője, azt kapjuk, hogy bármely n természetes szám esetén 1 · n = 00 · n = 0 · n + n = 0 + n = n, a korábbiak alapján.
Hasonlóan kapjuk, hogy 2 · n = 10 · n = 1 · n + n = n + n, stb Az ı́gy értelmezett műveletekkel kapcsolatban a szokásos jelöléseket és elnevezéseket használjuk. A k + m a k és m összege, mı́g k · m a k és m szorzata Ez utóbbit km módon is ı́rhatjuk. Az összeg tagjait összeadandóknak, a szorzat tagjait pedig tényezőknek nevezzük. Általában igaz az, hogy a k · m szorzat egy olyan k tagú összeget jelöl, melynek minden tagja m. Az alábbiakban összefoglaljuk a természetes számok összeadásának és szorzásának legfontosabb alaptulajdonságait. 2.21 Tétel Bármely k, m, n természetes számok esetén fennállnak a következők: (N1) k + m = m + k ,     28  A számfogalom  (N2) k + (m + n) = (k + m) + n , (N3) k + 0 = k , (N4) k · m = m · k , (N5) k · (m · n) = (k · m) · n , (N6) k · 1 = k , (N7) k · (m + n) = k · m + k · n . A tétel állı́tásainak bizonyı́tása a (P3) Peano–axióma
alapján történhet, a részleteket az Olvasóra bı́zzuk. Ezekből az azonosságokból látható, hogy mind az összeg, mind a szorzat független a tagok sorrendjétől, amit úgy szokás kifejezni, hogy mindkét művelet kommutatı́v. Ezt fejezik ki az (N1) és (N4) tulajdonságok A műveletek mindegyike asszociatı́v, azaz a tagok tetszőlegesen csoportosı́thatók az (N2) és (N5) azonosságok szerint. Természetesen mind a kommutativitási, mind az asszociativitási szabály teljes indukcióval kiterjeszthető kettőnél több tagra, illetve tényezőre. Ennek köszönhetően tehát a k + (l + m) + n, illetve k · (l · m) · n, s hasonló alakú kifejezésekben a zárójelek elhagyhatók, s ezek k + l + m + n, illetve klmn alakban is felı́rhatók. Az is látható, hogy az összeadással kapcsolatban a 0, a szorzással kapcsolatban pedig a 0 rákövetkezője, az 1 megkülönböztetett szerepet játszik. Ezek az
elemek bizonyos értelemben semlegesek: valamihez 0-t hozzáadni, vagy valamit 1-el megszorozni annyi, mint ha semmit sem csináltunk volna. Végül az utolsó azonosság a két művelet egymással való kapcsolatáról szól, s a neve: disztributivitás A továbbiakban teljesen megfeledkezhetünk arról, hogy a természetes számok halmazát valójában mik alkotják, csupán az az érdekes, hogy a természetes számok halmaza kielégı́ti a Peano–axiómákat, melyek következtében értelmezett rajta a fenti tulajdonságokkal rendelkező két művelet. Tehát nem az az érdekes, hogy ”mi az, hogy természetes szám?”, hanem az, hogy ”mit lehet a természetes számokkal csinálni?”. A természetes számok fogalmának ilyen módon történő értelmezése meglehetősen tipikus példája az axiomatikus módszer alkalmazásának. A fenti (N1)-(N7) tulajdonságokból tehát levezethetők mindazon számolási
szabályok, amelyek a természetes számok körében az összeadásra és a szorzásra vonatkoznak. Ezek közül kiemelünk egyet 2.22 Tétel Bármely k, m, n természetes számok esetén ha k + m = k + n, akkor m = n . Bizonyı́tás. Az állı́tás bizonyı́tása k szerinti teljes indukcióval történik: ha k = 0, akkor az állı́tás nyilván igaz. Tegyük fel, hogy az állı́tás igaz k esetén, s bizonyı́tsuk be k + 1-re: ha (k + 1) + m = (k + 1) + n ,     A természetes számok rendezése  29  akkor tehát k + (m + 1) = k + (1 + m) = (k + 1) + n = k + (1 + n) = k + (n + 1) . Az indukciós feltevés szerint ebből m + 1 = n + 1 adódik. Viszont m + 1 az mnek, n + 1 pedig az n-nek a rákövetkezője, tehát a (P2) Peano–axióma alapján m = n, s az állı́tást bebizonyı́tottuk.  A tételben foglalt tulajdonság neve: egyszerűsı́tési szabály, az összeadásra nézve. Vegyük észre, hogy ez nyilvánvaló
lenne, ha a természetes számok halmazában lehetne kivonni, ám erre nincs lehetőség A természetes számokkal végezhető műveletek további, a mindennapi számolásból jól ismert tulajdonságai a fenti tulajdonságokból könnyen levezethetők. Így például  mint azt korábban megjegyeztük  az azonos összeadandók összege szorzatként fejezhető ki, az azonos tényezőjű szorzatokra pedig a szokásos hatvány jelölés alkalmazható. Tehát, ha n egy természetes szám, akkor az n · n szorzat neve ”n a másodikon”, vagy ”n négyzet”, jele pedig n2 . Hasonló elnevezéseket és jelöléseket alkalmazunk a kettőnél több tényezős szorzatok, valamint az egytényezős szorzat esetében is Általában, ha n természetes szám, k pedig 0-tól különböző természetes szám, akkor a k tényezős n · n · · · · · n szorzatot, ahol a tényezők száma k, a szokott módon, nk alakban
ı́rjuk fel, neve pedig ”n a k-adikon”. Az nk számot az n természetes szám k-adik hatványának nevezzük. Ebben a kifejezésben n neve hatványalap, vagy röviden alap, k pedig a hatványkitevő, vagy röviden kitevő. A hatványozást k = 0 kitevőre is kiterjesztjük az n0 = 1 definı́cióval, de csak akkor, ha n 0-tól különböző természetes szám. A 0 szám 0-dik hatványát nem értelmezzük Az alábbi tételben összefoglaljuk a hatványozásnak azokat az alaptulajdonságait, melyek a szorzás tulajdonságainak azonnali következményei. 2.23 Tétel Bármely k, m, n nullától különböző természetes számok esetén érvényesek a következők: (i) k m+n = k m · k n , ¡ ¢n (ii) k m = k m·n , ¡ ¢n (iii) k · m = k n · mn . A természetes számok összeadására és szorzására vonatkozó (N1)-(N7) alapszabályokat jól jegyezzük meg, mert a későbbiekben, amikor a számkört
bővı́tjük, az lesz a vezérelv, hogy ezek az azonosságok a bővebb számkörökben értelmezendő műveletekre is érvényben maradjanak.     30  2.3  A számfogalom  A természetes számok rendezése  A természetes számok halmazában fel lehet vetni a következő tı́pusú egyenletek megoldhatóságának kérdését: m + x = n,  (7)  ahol m, n adott természetes számok, x pedig a keresett természetes szám, az egyenletben szereplő ismeretlen. Melyik az a természetes szám, amelyet m-hez hozzá kell adni, hogy n-t kapjuk eredményül? Tapasztalatból tudjuk, hogy ez a feladat a természetes számok körében nem mindig oldható meg: pontosan akkor van olyan x természetes szám, mely az előbbi egyenletet kielégı́ti, ha m nem nagyobb n-nél. Igen ám, de eddig még nem beszéltünk olyasmiről, hogy egy természetes szám kisebb, vagy nagyobb egy másik természetes számnál: ezt a fogalmat még nem
definiáltuk. Valójában a (7) egyenlet kiválóan alkalmas arra, hogy segı́tségével értelmezzük a ”kisebb, vagy egyenlő” fogalmát természetes számok között: akkor mondjuk, hogy az m természetes szám kisebb, vagy egyenlő, mint az n természetes szám, ha van olyan x természetes szám, amelyre fennáll (7). Nem nehéz megmutatni, hogy ekkor ez az x egyértelműen meg van határozva. Ezt ı́gy jelöljük: m ≤ n, vagy n ≥ m Akkor mondjuk, hogy az m természetes szám kisebb, mint az n természetes szám, ha m kisebb, vagy egyenlő, mint n, de m 6= n. Ennek jelölése m < n, vagy n > m Akkor mondjuk, hogy az m természetes szám nagyobb, vagy egyenlő, mint az n természetes szám, ha n kisebb, vagy egyenlő, mint m, s végül akkor mondjuk, hogy az m természetes szám nagyobb, mint az n természetes szám, ha n kisebb, mint m. Nem nehéz megmutatni, hogy az ilyen módon értelmezett ≤ kapcsolat
rendelkezik a következő tételben foglalt tulajdonságokkal 2.31 Tétel Bármely k, m, n természetes számok esetén (N8) k ≤ k , (N9) ha k ≤ m és m ≤ k, akkor k = m , (N10) ha k ≤ m és m ≤ n, akkor k ≤ n , (N11) k ≤ m, vagy m ≤ k , (N12) ha k ≤ m, akkor k + n ≤ m + n , (N13) ha k ≤ m, akkor k · n ≤ m · n . Bizonyı́tás. Illusztrációként lássuk az (N13) bizonyı́tását! A feltevés szerint k ≤ m, ı́gy van olyan x természetes szám, hogy k + x = m. Ekkor az (N7) tulajdonság alapján k · n + x · n = (k + x) · n = m · n , tehát k · n ≤ m · n. A többi állı́tás bizonyı́tása hasonlóan egyszerű     Az egész számok  31  A tételben felsorolt tulajdonságoknak nevük is van. Az első négy tulajdonság neve sorrendben reflexivitás, antiszimmetria, tranzitivitás és linearitás, mı́g az utolsó kettőt a ≤ kapcsolat műveletekre vonatkozó monotonitásának szokás nevezni. Az
első négy tulajdonsággal rendelkező kapcsolat neve rendezés A < szigorú egyenlőtlenségre vonatkozó legfontosabb tulajdonságokat is felsoroljuk a következő tételben. Ezek a fenti tulajdonságok logikai következményei 2.32 Tétel Bármely k, m, n természetes számok esetén (i) k ≮ k , (ii) ha k < m, akkor m ≮ k , (iii) ha k < m és m < n, akkor k < n , (iv) k < m, k = m és m < k közül pontosan egy teljesül , (v) ha k < m, akkor k + n < m + n , (vi) ha k < m és n 6= 0, akkor k · n < m · n . Itt ≮ a < tagadását jelenti, ami éppen ≥. Az első tulajdonság az irreflexivitás, a második az aszimmetria, a harmadik ismét a tranzitivitás, mı́g a negyedik a trichotómia. A két utolsót ugyancsak monotonitásnak hı́vjuk a műveletekre nézve. Az állı́tások bizonyı́tását az Olvasóra bı́zzuk A felsorolt tulajdonságok az egyenlőtlenségekkel kapcsolatos
legfontosabb szabályokat rögzı́tik, s belőlük könnyen levezethetők további összefüggések. Ismét jegyezzük meg, hogy a számfogalom további bővı́tése során a felsorolt tulajdonságoknak az érvényességét igyekszünk fenntartani A rendezéssel kapcsolatban néhány további elnevezést a hétköznapi gyakorlatnak megfelelően fogunk használni. Ilyen például egy halmaz legkisebb, illetve legnagyobb eleme: ha S a természetes számok halmazának egy részhalmaza, akkor ennek s a legkisebb, illetve legnagyobb eleme, ha s az S-nek olyan eleme, hogy minden S-beli x elem esetén s ≤ x, illetve s ≥ x teljesül. Az S legkisebb, illetve legnagyobb elemét szokás az S minimumának, vagy minimális elemének, nevezni, mı́g az S legkisebb, illetve legnagyobb elemét az S maximumának, vagy maximális elemének nevezzük. Ezeket min S, illetve max S módon jelöljük A természetes számok halmazának nyilván 0
a legkisebb eleme, legnagyobb eleme pedig nincs, hiszen n < n + 1 minden n természetes szám esetén teljesül. Van azonban a természetes számok halmazának egy nagyon fontos tulajdonsága, amelyet a következő tétel fejez ki. 2.33 Tétel A természetes számok halmazában minden nem üres részhalmaznak van legkisebb eleme. A természetes számok halmazának ezt a tulajdonságát úgy szokás kifejezni, hogy ez a halmaz jólrendezett.     32  2.4  A számfogalom  Az egész számok  Visszatérve a (7) egyenlethez, illetve annak megoldhatóságához, felvetődik a kérdés, hogy mi van akkor, ha m > n? Ekkor tehát az egyenletnek nincs megoldása a természetes számok körében. Érthető, hogy ezek után nyilvánvalóan adódik az újabb kérdés: vajon lehet-e a természetes számok halmazát valamilyen olyan új objektumokkal, ”szám”-nak tekinthető dolgokkal úgy bővı́teni, hogy a kibővı́tett halmaznak
már minden m, n eleme esetén létezzen olyan x eleme, amelyre fennáll (7)? Tapasztalatból tudjuk, hogy a válasz igenlő: a negatı́v számok bevezetése éppen ezt a problémát hivatott megoldani. De vajon mik a negatı́v számok? Pontosabban: miket nevezzünk negatı́v számoknak? Teljesen értelmetlen lenne erre rávágni, hogy ”a természetes számok negatı́vjait”, hiszen a ”negatı́v”, ”negatı́vja” fogalmaknak pillanatnyilag semmi értelme nincs. A ”szám” nekünk egyenlőre annyit jelent, hogy ”természetes szám”, az pedig nem más, mint a természetes számok halmazának egy eleme. A negatı́v számok bevezetésekor sokkal körültekintőbben kell eljárni Térjünk vissza egy időre a (7) egyenlethez. Ez az egyenlet az m ≤ n esetben egyértelműen meghatározza az xet, vagyis azt a természetes számot, amit  szı́vünk és tapasztalataink szerint  az n és m különbségének neveznénk:
ez az összeadásra vonatkozó egyszerűsı́tési szabálynak köszönhető. Másrészt, az (m, n) rendezett számpár, ami tehát általában különbözik az (n, m) rendezett számpártól, viszont egyértelműen meghatározza a (7) egyenletet, tehát  közvetve  az x-et Állapodjunk meg abban, hogy mostantól az olyan (m, n) természetes számokból álló rendezett párokat, melyeknél a (7) egyenletnek létezik megoldása, egyszerűen azonosnak tekintjük magával a megoldással. Ez, mint fentebb megjegyeztük, egyértelműen meg van határozva m és n által. Ha tehát azt mondom, hogy ”a (0, 1) szám”, akkor valójában a 0 + x = 1 egyenlet egyetlen x megoldására gondolok, vagyis 1-re. Hasonlóan, a (4, 11) ”szám” valójában a 7 számot jelenti, mı́g (26, 26) a 0-val azonos. Az Olvasóban nyilván felvetődik a kérdés: mi értelme van ennek az egész hókusz-pókusznak, hogy 4 helyett (12,
16)-ot mondunk? A dolognak az az értelme, hogy ha ezt az ı́rás- és beszédmódot elfogadjuk, akkor akár el is feledkezhetünk arról a kikötésről, hogy csak olyan (m, n) rendezett párokról beszélhetünk, amelyeknél a (7) egyenletnek létezik megoldása. Ha a (2, 9) rendezett párt ”szám”-nak tekintjük, miért ne tekinthetnénk ”szám”-nak a (9, 2) rendezett párt is? Erre azt mondhatja valaki, hogy azért, mert nincs olyan x természetes szám, hogy 9 + x = 2 teljesül. Persze, hogy nincs, ezt eddig is tudtuk, hogy a természetes számok között nincs ilyen, hiszen éppen ezért akarjuk a természetes számok halmazát újabb objektumokkal bővı́teni. Mondjuk, mostantól az összes (m, n) alakú rendezett párokat ”szám”-nak tekintjük, s ezek közül azok a természetes számok, amelyeknél a (7) egyenletnek létezik megoldása, a többi ”nemtermészetes szám”. Ez ı́gy rendben is volna, de
mitől lesznek a ”nemtermészetes számok” egyáltalán ”szám”-ok? Jó lenne, ha legalább számolni lehetne velük, mondjuk össze lehetne őket adni, és össze lehetne őket szorozni ugyanolyan szabályok szerint mint a ”korábbi ” természetes számokat. Hogyan értelmezzük például az (m, n) és (k, l) ”nemtermészetes számok” összegét? Ha egy pillanatra a természetes számok esetére gondolunk, akkor     2.4 Az egész számok  33  hamar rájövünk, hogy a kézenfekvő definı́ció: (m, n) + (k, l) = (m + k, n + l) , hiszen ha m ≤ n és k ≤ l teljesül, akkor nyilván m + k ≤ n + l is érvényes, továbbá az n + l és m + k különbsége éppen az n és m különbségének, valamint az l és k különbségének az összege. Emögött az húzódik meg, hogy titokban az (m, n) párra, mint az n−m különbségre gondolunk, ám ilyesmiről pillanatnyilag nem beszélhetünk.
Viszont könnyen ellenőrizhetjük, hogy ez a fajta ”összeadás” teljesı́ti az (N1)-(N3) tulajdonságokat, ha 0 helyére a (0, 0) párt képzeljük. Mielőtt hozzáfognánk a ”nemtermészetes számok” szorzásának értelmezéséhez, térjünk vissza a (7) egyenlethez, hiszen végtére is az volt a célunk, hogy olyan bővı́tését találjuk ki a természetes számok halmazának, melyben a megszokott szabályok szerint lehet ”számolni”, ráadásul a (7) egyenlet bármilyen m és n esetén megoldható. Igaz, egyenlőre még csak összeadni lehet, de a (7) egyenlethez ez éppen elég. Kicsit módosı́tva a jelöléseket a ”nemtermészetes számok” halmazában (7) a következő módon néz ki: (m, n) + (x, y) = (k, l) ,  (8)  ahol k, l, m, n adott természetes számok, x, y pedig keresett természetes számok. Figyelembe véve az összeadás értelmezését ez azt jelenti, hogy (m + x, n + y) = (k, l)
,  (9)  s ha figyelembe vesszük, hogy két rendezett pár akkor egyenlő, ha a komponenseik egyenlők, ez azt jelenti, hogy az m + x = k és n + y = l egyenlőségeknek kell teljesülni valamilyen x, y természetes számokkal. Ez viszont csak akkor lehetséges, ha m ≤ k és n ≤ l fennáll, tehát nem jutottunk előbbre: ismét az a helyzet, hogy egyenletünk csak bizonyos k, l, m, n esetén oldható meg. Feleslegesnek látszik tehát az eddigi bűvészkedés a rendezett párokkal és egyebekkel Ám korai lenne még feladni mindent. Tekintsük ugyanis a (k + n, l + m) ”nemtermészetes szám”-ot, és ezt adjuk hozzá az (m, n)-hez: (m, n) + (k + n, l + m) = (m + k + n, n + l + m) = (k + m + n, l + m + n) . (10) Ez a rendezett pár, a (k + m + n, l + m + n), pontosan akkor lenne természetes szám, ha az első komponense kisebb lenne, mint a második, vagy esetleg egyenlő lenne vele. Ez viszont pontosan akkor teljesülne, ha k ≤ l lenne
érvényes, és ekkor a k +x = l egyenlet egyértelmű x megoldását jelentené Ám ugyanezt jelenti a k + m + n + x = l + m + n egyenlet egyértelmű x megoldása is! Tehát a (k, l) pár ugyanazt a ”nemtermészetes szám”-ot jelöli, mint amit a (10) jobb oldalán álló (k + m + n, l + m + n) pár! Ha ezt felhasználva a (10) egyenlőség-sorozatot tovább folytatjuk, a következőt kapjuk: (m, n)+(k+n, l+m) = (m+k+n, n+l+m) = (k+m+n, l+m+n) = (k, l) , (11) vagyis mégiscsak találtunk az (8) egyenletnek egy ”nemtermészetes szám”megoldását: a (k + n, l + m) rendezett párt. Rövid gondolkodás után rá kell     34  A számfogalom  jönnünk a következőre: bár az m + x = n egyenlet, tehát az (m, n) rendezett pár egyértelműen meghatározza x-et, de ez fordı́tva nem ı́gy van: az x számos hasonló egyenletnek lesz megoldása, például az m + 1 + x = n + 1 egyenletnek, az m + 2 + x = n + 2 egyenletnek, és
általában minden olyan egyenletnek, amit úgy kapunk, hogy a (7) egyenlet mindkét oldalához hozzáadjuk ugyanazt a számot. Ez azt jelenti, hogy a ”nemtermészetes szám”-ok világában az (m, n), (m + 1, n + 1), (m + 2, n + 2), stb., párok ugyanazt az elemet jelölik annak ellenére, hogy mint rendezett párok, ezek nyilván egymástól különböznek. A cél érdekében tehát felül kell emelkednünk a rendezett párok egyenlőségének ”földhözragadt” fogalmán: a mi szemünkben mostantól az (m, n) és (p, r) rendezett párok akkor lesznek egyenlők, ha m + r = n + p teljesül. Vegyük észre, hogy itt az (m, n)-t valójában n − m-nek képzeljük, csak ilyenről még nem szabad beszélni, ám nyilván n − m pontosan akkor egyenlő r − p-vel, ha n − m = r − p, azaz m + r = n + p. Tulajdonképpen arról van szó, hogy osztályokba soroljuk az (m, n) alakú rendezett párokat. Egy osztályba azok
kerülnek, amelyekre az előbbi feltétel teljesül, tehát (m, n) és (p, q) akkor kerülnek egy osztályba, ha m + r = n + p. Ha ezek után egy osztály összes elemeit ugyanazon dolog különböző megnyilvánulásainak tekintjük, akkor kitágı́tjuk a rendezett párok egyenlőségének fogalmát. Nyilvánvaló, hogy ha az (m, n) és (p, q) rendezett párok tényleg egyenlők, akkor fennáll az ominózus m + r = n + p egyenlőség, hiszen ekkor m = p és n = q. Tehát az egymással egyenlő párok ugyanabba az osztályba tartoznak. Amik eddig egyenlők voltak, ezután is egyenlőnek számı́tanak. Az ”egyenlőség”-nek azonban van még legalább két olyan fontos tulajdonsága, ami ettől az ”ugyanabba az osztályba tartozás”-tól is elvárható. Az egyik az, hogy ha (m, n) osztályában benne van (p, q), akkor (p, q) osztályában is benne van (m, n): esetünkben ez teljesen nyilvánvaló, hiszen az
elsőhöz m + r = n + p kell, a másodikhoz pedig r + m = p + n, s a kettő ugyanazt jelenti. Szavakban ez a követelés azt fejezi ki, hogy ”ha én egyenlő vagyok veled, akkor te is egyenlő vagy velem”. Az egyenlőség másik fontos tulajdonsága úgy fogalmazható, hogy ”ha én egyenlő vagyok veled, s te egyenlő vagy vele, akkor én is egyenlő vagyok vele”. Esetünkben ez azt jelenti, hogy ha (m, n) osztályában benne van (p, q), és (p, q) osztályában benne van (k, l), akkor (m, n) osztályában benne van (k, l). Másszóval, ha m+r = n+p, és r +k = p+l, akkor m + l = n + k kell, hogy teljesüljön, de ez könnyen ellenőrizhető, hogy valóban ı́gy van. Tehát az ”ugyanabba az osztályba tartozás” rendelkezik az egyenlőség legalapvetőbb tulajdonságaival: nem követünk el nagy hibát, ha az ugyanazon osztályba tartozó párokat ezentúl egyenlőknek tekintjük. Olyan ez, mintha egy gyengébb
szemüveget tennénk fel, amellyel már nem tudunk különbséget tenni egy osztály elemei között, mert azok annyira összemosódnak, hogy nem is érdemes megpróbálni megkülönböztetni őket, elég csak azt tudni, hogy melyik osztályhoz tartoznak. Valójában tehát a ”nemtermészetes szám”-ok helyett az ő osztályaikkal foglalkozunk, ezeket nevezzük egész számoknak. Így például kissé vissza kell térnünk az összeadás értelmezéséhez: melyik osztály lesz az (m, n) és (k, l) párok osztályainak összege? Azt mondhatjuk, hogy az (m + k, n + l) pár osztálya. Igen ám, de mi van, ha az (m, n) és (k, l) párok osztályaiból két másik rendezett párt, mondjuk az (m1 , n1 ) és (k1 , l1 ) párokat választjuk ki, mi-     2.4 Az egész számok  35  előtt összeadnánk az osztályaikat? Ugyanaz az osztály lesz az eredmény? Ez nagyon fontos, hiszen a műveletet az osztályok között
értelmezzük, s ezért az eredménynek függetlennek kell lennie attól, hogy az adott osztályokból éppen melyik ”reprezentánsokat” választottuk ki. Ezzel szerencsére nincsen probléma, hiszen a feltevés szerint (m, n) és (m1 , n1 ) ugyanabban az osztályban vannak, tehát fennáll m + n1 = n + m1 , s hasonlóan, (k, l) és (k1 , l1 ) ugyanabban az osztályban vannak, tehát fennáll k + l1 = l + k1 . A két egyenlőséget összeadva azt kapjuk, hogy m + k + n1 + l1 = n + l + m1 + k1 , ami azt jelenti, hogy (m1 + k1 , n1 + l1 ) ugyanabban az osztályban van, mint (m + k, n + l), vagyis az ”osztályösszeg” nem függ a reprezentánsok választásától. Talán kissé hosszúra nyúlt az egész számok értelmezéséhez fűzött magyarázat, de azt világosan kell látni, hogy nem az a legfontosabb kérdés, hogy mik az egész számok, hanem az, hogy mit lehet velük csinálni. A fentiekben ugyan bemutattunk egy
konstrukciót, amelynek segı́tségével a már korábban értelmezett természetes számok halmazából meg lehet konstruálni az egész számok halmazát, de ennél sokkal fontosabb annak a néhány alaptulajdonságnak a felsorolása, amellyel az egész számokon értelmezett összeadás, és a most értelmezendő szorzás rendelkeznek, hiszen a mindennapi számolás során közömbös számunkra az, hogy mit jelent az 1, a −3, stb., sokkal fontosabb azt tudni, hogy hogyan kell ezekkel számolni. Mielőtt azonban a szorzást értelmeznénk, rögzı́tsük az összeadás legfontosabb tulajdonságait, illetve ezzel kapcsolatban néhány jelölést. Jelölje Z az egész számok halmazát, amely tehát a természetes számokból képzett rendezett párok fenti módon értelmezett osztályaiból áll. Ha (m, n) egy ilyen pár, akkor az osztályát jelölje a = (m, n). Az a osztályba tehát mindazon (p, r) rendezett
párok tartoznak, amelyek komponensei természetes számok, s amelyekre fennáll m + r = n + p. A (0, 0) pár osztályát 0-val fogjuk jelölni, ebbe természetesen beletartoznak az összes (p, p) alakú párok, és semmi más. Ha a és b két egész szám, tehát a Z halmaz két eleme, és mondjuk a = (m, n), b = (k, l), akkor definı́ció szerint legyen a + b az (m + k, n + l) pár osztálya, tehát a + b = (m + k, n + l) .  (12)  Az a + b egész számot az a és b összegének nevezzük, a-t és b-t pedig összeadandóknak. A fentiekben láttuk, hogy az összeg nem függ az a és b osztályok reprezentánsainak választásától. Ha a = (m, n), akkor az (n, m) egész számot jelölje −a. Tehát a −a osztályba pontosan akkor tartozik egy (p, q) pár, ha (q, p) az a osztályba tartozik. A −a természetes számot az a ellentettjének, vagy negatı́vjának nevezzük. Így például −0 = 0 Könnyű ellenőrizni,
hogy a −a osztály nem függ a a reprezentánsának választásától. Most az egész számok szorzását fogjuk értelmezni. A definı́ció megértéséhez ismét gondoljunk arra, hogy az (m, n) pár valójában n − m-et akarja jelenteni, de kivonásról még nincs értelme beszélni. Ha a, b egész számok, mondjuk a = (m, n), b = (k, l), akkor definı́ció szerint     36  A számfogalom  legyen a · b az (m · p + n · r, m · r + n · p) pár osztálya, tehát a · b = (m · p + n · r, m · r + n · p) .  (13)  Az a · b helyett ı́rhatunk ab-t is. Az ab egész számot az a és b szorzatának nevezzük, a-t és b-t a szorzat tényezőinek Könnyű ellenőrizni, hogy az ab szorzat nem függ az a és b osztályok reprezentánsainak választásától. A (0, 1) osztályt 1-el fogjuk jelölni, ebbe tehát az összes (m, m + 1) alakú párok tartoznak és semmi más. Itt az idő, hogy az alábbi tételben
összefoglaljuk az egész számok összeadásának és szorzásának legfontosabb tulajdonságait. 2.41 Tétel Bármely a, b, c egész számok esetén érvényesek a következők: (Z1) a + b = b + a , (Z2) a + (b + c) = (a + b) + c , (Z3) a + 0 = a , (Z4) a + (−a) = 0 , (Z5) a · b = b · a , (Z6) a · (b · c) = (a · b) · c , (Z7) a · 1 = a , (Z8) a · (b + c) = a · b + a · c . Bizonyı́tás. Csupán az illusztráció kedvéért lássuk a (Z8) állı́tás bizonyı́tását! A (Z8) egyenlőség két oldalán egy-egy halmaz áll, melyek egyenlősége azt jelenti  amint azt a fentiekben láttuk,  hogy kölcsönösen tartalmazzák egymást. Vezessük be az M = a · (b + c) és N = a · b + a · c jelöléseket, továbbá legyen x az M halmaz egy tetszőleges eleme. Miután az M halmaz bizonyos tulajdonságú rendezett párok halmaza, ı́gy inkább x helyett ı́rjunk (x, y)-t, ahol x és y olyan természetes számok, hogy
az (x, y) pár beletartozik az a · (b + c) osztályba. Tehát (x, y) egy a osztálybeli (m, n) párból és egy b + c osztálybeli párból keletkezett az (13) definı́cióban megadott módon, ahol az ottani b helyett most b + c szerepel. A b + c elemei (k + p, l + r) alakú párok, ahol (k, l) a b, (p, r) pedig a c eleme. Az (13) definı́ciót figyelembe véve tehát az (x, y) pár alakja a következő: (ml + mr + nk + np, mk + mp + nl + nr) , ami a következő módon is ı́rható: ¡ ¢ (ml + nk) + (mr + np), (mk + nl) + (mp + nr) = = (ml + nk, mk + nl) + (mr + np, mp + nr) .     2.4 Az egész számok  37  Definı́cióink alapján világos, hogy itt az egyenlőség jobb oldalán az a · b + a · c osztály egy eleme áll, amivel igazoltuk az M ⊆ N egyenlőséget. A fordı́tott irányú tartalmazás bizonyı́tásához ugyanezt az érvelést kell visszafelé alkalmaznunk. Valóban, az utolsó egyenlőség jobb oldalán az N
halmaz egy tetszőleges eleme áll, ami az előző egyenlőség alapján az M halmaznak eleme, ı́gy N ⊆ M is teljesül, s ezzel a (Z8) azonosságot bebizonyı́tottuk. A tétel többi állı́tása hasonló egyszerű módon igazolható, melynek részleteit az Olvasóra bı́zzuk. Láthatjuk, hogy az egész számokkal kapcsolatos alapszabályok bizonyı́tásakor nincs szükségünk arra, hogy a természetes számok valójában micsodák, csupán a rájuk vonatkozó műveleti szabályokat kell ismernünk. Ugyanez a helyzet az egész számokra vonatkozó további azonosságok igazolásával: már csak az eddig bizonyı́tott tulajdonságokat kell ügyesen felhasználnunk, az teljesen mindegy, hogy ezek milyen objektumokra vonatkoznak. Az eddigiek alapján az egész számok halmazában értelmezhetjük a kivonást a következő módon: ha a és b két egész szám, akkor a − b különbségük alatt az a + (−b)
egész számot értjük. Az a-t kisebbı́tendőnek, a b-t kivonandónak nevezzük. Könnyű látni, hogy az a − b különbség pontosan a b+x=a egyenlet egyértelmű megoldása az egész számok halmazában. A kivonással kapcsolatos jól ismert műveleti szabályok felsorolásától és bizonyı́tásától itt eltekintünk, ezt az Olvasóra bı́zzuk Röviden vissza kell térnünk arra a problémára, hogy az egész számok bevezetésekor a természetes számok halmazának bővı́téséről beszéltünk, ami alatt valami olyasmit kellene érteni, hogy az egész számok halmazának tartalmaznia kellene a természetes számok halmazát. Ám ez láthatólag nem ı́gy van: a természetes számok halmaza egy bizonyos, a Peano–axiómáknak eleget tevő halmaz, mı́g az egész számok halmaza valami más: a természetes számokból képzett rendezett párok bizonyos osztályainak halmaza. Mi tehát a kapcsolat
N és Z között? Valójában arról van szó, hogy a Z halmaznak van egy olyan részhalmaza, amely kielégı́ti a Peano–axiómákat, s a fentiekben megjegyeztük, hogy az összes ilyen halmaz azonosnak tekinthető. Valóban, tekintsük a Z halmaz azon N0 részhalmazát, mely az összes (0, n) alakú párok osztályaiból áll, ahol n tetszőleges természetes szám. Tehát az N0 -hoz tartozik a (0, 0) osztálya  amelyet korábban 0-val jelöltünk,  a (0, 1) osztálya  amelyet korábban 1-el jelöltünk,  a (0, 2) osztálya, stb. Az N0 halmazban az o szerepét tehát a (0, 0) osztályának adva, s a (0, n) osztály rákövetkezőjének a (0, n+1) osztályt tekintve könnyen ellenőrizhetjük, hogy ezzel a szereposztással az N0 halmaz kielégı́ti a Peano–axiómákat, ı́gy korábbi megjegyzéseink alapján azonosnak tekinthető Nel. Az azonosı́tást az n ↔ (0, n) megfeleltetés adja Végeredményben tehát az a
kijelentés, hogy ”Z tartalmazza N-t”, vagy ami ugyanaz ”minden természetes     38  A számfogalom  szám egész szám” azt jelenti, hogy a Z halmaznak van egy olyan részhalmaza, amelyet joggal tekinthetünk azonosnak a természetes számok halmazával. Eddig is tudtuk, hogy a természetes számok halmazának többféle ”megnyilvánulása” van, nos, ezek egyike N0 . Így a továbbiakban valóban használhatjuk az N ⊆ Z ı́rásmódot, pontosan tudva ennek jelentését. Valójában még azt is tudjuk, hogy N ⊂ Z érvényes.  2.5  Az egész számok rendezése  A Z halmaz azon elemeit, melyek az N halmaz 0-tól különböző elemei, pozitı́v egész számoknak, azokat pedig amelyek nem tartoznak N-hez, negatı́v egész számoknak nevezzük. Most már abban a helyzetben vagyunk, hogy a természetes számok halmazában bevezetett ”kisebb, vagy egyenlő”, ”kisebb”, ”nagyobb, vagy egyenlő”, ”nagyobb”
fogalmakat könnyedén értelmezhetjük az egész számok halmazában is. Nevezetesen, akkor mondjuk, hogy az a egész szám kisebb, vagy egyenlő, mint a b egész szám, ha b − a nem negatı́v; akkor mondjuk, hogy az a egész szám kisebb, mint a b egész szám, ha b − a pozitı́v; akkor mondjuk, hogy az a egész szám nagyobb, vagy egyenlő, mint a b egész szám, ha a − b nem negatı́v; s végül akkor mondjuk, hogy az a egész szám nagyobb, mint a b egész szám, ha a − b pozitı́v. Az ezzel kapcsolatos jelölések megegyeznek a korábbiakkal Könnyen ellenőrizhetjük, hogy amennyiben a, b természetes számok, akkor ezek a definı́ciók ugyanazt jelentik, mint a természetes számokra már korábban bevezetett hasonló fogalmak. Megjegyezzük, hogy ezek szerint a nem negatı́v egész számok pontosan a természetes számok. Az egész számok ≤ rendezésével kapcsolatban érvényesek a következő tételben
foglalt tulajdonságok, melyek igazolását az Olvasóra bı́zzuk. 2.51 Tétel Bármely a, b, c egész számok esetén fennállnak a következők: (Z9) a ≤ a , (Z10) ha a ≤ b és b ≤ a, akkor a = b , (Z11) ha a ≤ b és b ≤ c, akkor a ≤ c , (Z12) a ≤ b, vagy b ≤ a , (Z13) ha a ≤ b, akkor a + c ≤ b + c , (Z14) ha a ≤ b és c ≥ 0, akkor a · c ≤ b · c . Hasonlóan kapjuk a szigorú egyenlőtlenségre vonatkozó azonosságokat a következő tételben. 2.52 Tétel Bármely a, b, c egész számok esetén érvényesek a következők: (i) a ≮ a ,     Az egész számok hatványozása  39  (ii) ha a < b, akkor b ≮ a , (iii) ha a < b és b < c, akkor a < c , (iv) a < b, a = b és b < a közül pontosan egy teljesül , (v) ha a < b, akkor a + c < b + c , (vi) ha a < b és c 6= 0, akkor a · c < b · c . A bizonyı́tásokat az Olvasóra bı́zzuk. Viszont hasznos lesz megvizsgálni az
összeadásra és a szorzásra vonatkozó egyszerűsı́tési szabályok érvényességét az egész számok halmazában. 2.53 Tétel Bármely a, b, c egész számok esetén (i) ha a + b = a + c, akkor b = c , (ii) ha a 6= 0, és a · b = a · c, akkor b = c . Bizonyı́tás. Az első állı́tás ezúttal teljesen nyilvánvaló, hiszen az a + b = a + c egyenlet mindkét oldalához hozzáadva a −a számot b = 0 + b = (−a + a) + b = −a + (a + b) = −a + (a + c) = (−a + a) + c = 0 + c = c adódik, amit bizonyı́tani kellett. Eljárásunkat a 222 tétel bizonyı́tásával összehasonlı́tva láthatjuk, hogy mennyit segı́t a −a elem létezése A második állı́tás bizonyı́tása: indirekt módon, tételezzük fel, hogy b 6= c, ekkor (Z12) miatt b < c, vagy c < b teljesül. Mivel a 6= 0, ezért a 252 tétel (vi) tulajdonsága miatt az első esetben a · b < a · c teljesül, a másodikban pedig a · c <
a · b, ami mindkét esetben ellentmondás. A tétel szerint az egész számok szorzására érvényes az a jól ismert szabály, hogy egy szorzat értéke csak akkor lehet 0, ha valamelyik tényezője 0.  2.6  Az egész számok hatványozása  Könnyű látni, hogy a hatványozás fogalma, s a vele kapcsolatos azonosságok értelemszerűen, változtatás nélkül átvihetők az egész számokra, de csak abban az esetben, ha a hatványkitevő természetes szám. Ha tehát a 6= 0 egész szám, akkor a0 = 1, ha pedig a tetszőleges egész szám, és n 6= 0 természetes szám, akkor an azt az n tényezős szorzatot jelenti, melynek minden tényezője a. Ilyen feltételek mellett érvényesek a 2.23 tételben szereplő azonosságok Ezt a következő tételben foglalhatjuk össze. 2.61 Tétel Bármely a, b nullától különböző egész számok és m, n természetes számok esetén érvényesek a következők: 
   40  A számfogalom  (i) am+n = am · an , ¡ ¢n (ii) am = am·n , ¡ ¢n (iii) a · b = an · bn .  2.7  A racionális számok  A fentiekben sikerült egy olyan számfogalmat kialakı́tani, amely lényegében csupán a számlálás műveletéből kiindulva a kapott számkörben lehetővé teszi az összeadás, a kivonás és a szorzás korlátlan elvégzését a mindennapi életből megszokott szabályok szerint. Természetesen felvetődik a kérdés: mi a helyzet az osztással? Ha a, b egész számok, akkor azt mondjuk, hogy b osztható a-val, illetve a osztója b-nek, ha van olyan x egész szám, hogy a·x=b  (14)  teljesül. Vegyük észre, hogy ez az egyenlet formailag azonos a (7) egyenlettel, csak összeadás helyett szorzás szerepel benne. Másszóval, ez azt jelenti, hogy a b egész szám pontosan akkor osztható az a egész számmal, ha a (14) egyenletnek az egész számok halmazában van x megoldása. Jól
tudjuk, hogy ez nem minden a, b egész számpár esetén teljesül Teljesen hasonló tehát a helyzet ahhoz, mint amikor az egész számok bevezetésének szükségessége merült fel: ahhoz, hogy a (14) egyenletnek bármely a, b egész számpár esetén legyen megoldása, ismét bővı́teni kell a számkört. Az újabb bővı́tés a korábbihoz teljesen hasonló módon, ugyanazon elvek alapján történik. Egyetlen apró különbség, hogy a (14) egyenletet tetszőleges b mellett csak a 6= 0 esetén fogjuk vizsgálni, aminek az az egyszerű oka, hogy ha a = 0, akkor bármely x egész szám esetén a · x = 0, ı́gy ekkor az egyenlet jobb oldalán csak 0 állhat, ami viszont érdektelen eset, hiszen ekkor viszont tetszőleges x megoldás. Mielőtt tovább mennénk, röviden összefoglaljuk az egész számok oszthatóságával kapcsolatos legfontosabb tudnivalókat. Mivel az a egész szám pontosan akkor osztható a b
egész számmal, ha a osztható −b-vel, illetve ha −a osztható b-vel, illetve ha −a osztható −b-vel, ı́gy elegendő a természetes számokkal foglalkoznunk, ám mondandónk és jelöléseink egész számokra is érvényesek. Azt a tényt, hogy az a természetes szám osztója a b természetes számnak a|b módon szokás jelölni. Nyilván minden természetes szám osztható 1-el és önmagával. Ha egy természetes számnak nincs más osztója, akkor prı́mszámnak nevezzük, ellenkező esetben összetett számnak. Ha két természetes számnak az egyetlen közös osztója 1, akkor a két számot relatı́v prı́meknek nevezzük. Ha egy természetes szám 2-vel osztható, akkor páros számnak nevezzük, ellenkező esetben páratlan számnak. Az aritmetika legfontosabb tétele a következő: 2.71 Tétel Minden pozitı́v természetes szám egyértelműen ı́rható fel prı́mszámok szorzataként    
2.7 A racionális számok  41  Az egyértelműség természetesen a prı́mszámok sorrendjétől eltekintve értendő. A tételben emlı́tett szorzat tényezőit az illető szám prı́mtényezőinek, magát a felı́rást pedig a szám prı́mtényezős felbontásának nevezzük. Visszatérve eredeti problémánkhoz, kiindulási pontunk tehát a (14) egyenlet, ahol b tetszőleges, a pedig 0-tól különböző egész szám. Azonban szükségünk van még az egész számoknak egy fontos tulajdonságára a szorzással kapcsolatban. Emlékeztetünk arra, hogy az (7) egyenlettel kapcsolatban kulcsfontosságú volt az a tény, hogy ez az egyenlet a természetes számok körében egyértelműen oldható meg, ha egyáltalán megoldható, ami az összeadásra vonatkozó egyszerűsı́tési szabály következménye. Világos, hogy ugyanezt a (14) egyenlettel kapcsolatban is tudnunk kell: ha valamely a 6= 0 és
tetszőleges b egész számok esetén az egyenlet megoldható, akkor a megoldás egyértelmű legyen. Ez viszont éppen a korábban látott, egész számok szorzására vonatkozó egyszerűsı́tési szabály következménye. Ettől a ponttól kezdve ugyanúgy folytathatjuk egy új számstruktúra kialakı́tását, amint azt az egész számok esetében tettük. Tekintsük először is az összes olyan egész számokból képzett (a, b) rendezett párok halmazát, melyeknél b 6= 0. Ez az egyetlen különbség a korábbiakhoz képest, de e kikötés szükségessége könnyen megérthető, ha arra gondolunk, hogy ezek az (a, b) párok pillanatnyilag az ab ”törtek” helyett állnak, de ”törtekről” egyelőre nem beszélhetünk. Mindenesetre ezeket a rendezett párokat is osztályokba fogjuk sorolni, annak megfelelően, hogy például a későbbiekben az (1, 2) pár és a (3, 6) pár ugyanazt az 21 = 63
törtet fogja jelenteni. Meg kell tehát állapodnunk abban, hogy az (a, b) és (c, d) párok mikor kerülnek egy osztályba, vagyis mikor fogjuk őket azonosnak tekinteni. Nos, világos, hogy pontosan akkor, ha a · d = b · c, annak megfelelően, hogy az ab és dc törtek a ”valóságban” pontosan akkor egyenlők, ha ez a feltétel teljesül. Az ilyen módon létrejövő osztályok halmazát racionális számok halmazának nevezzük, elemeit pedig racionális számoknak A racionális számok halmazát Q jelöli. A gyakorlatban magukat az (a, b) párokat szokás törteknek nevezni, ahol a a a tört számlálója, b pedig a nevezője. Természetesen további feladataink vannak: az alapműveletek értelmezése a racionális számok halmazában, az egész számok ”elhelyezése” a racionális számok halmazában, valamint annak vizsgálata, hogy ezek az újfajta számok eleget tesznek-e elvárásainknak, tehát
segı́tségükkel megoldható-e a (14) egyenlet bármely a 6= 0 és b racionális számok mellett. Az egész számok esetében alkalmazott jelölést használva, ha a, b egész számok és b 6= 0, akkor az (a, b) rendezett pár osztályát (a, b) fogja jelölni. Természetesen  az osztályok értelmezése folytán  ez bármely 0-tól különböző c egész szám esetén megegyezik az (a · c, b · c) osztállyal. A (0, 1) osztályát 0-val, az (1, 1) osztályát 1-el fogjuk jelölni. Ha a, b egész számok, b 6= 0, és p = (a, b), akkor a (−a, b) pár osztályát −p-vel jelöljük. Végül, ha a 6= 0 és b 6= 0, továbbá     42  A számfogalom  p = (a, b), akkor a (b, a) pár osztályát p−1 -el jelöljük. A 0 osztályt nullának, vagy zérusnak, az 1 osztályt egynek, vagy egységnek nevezzük. A −p osztály a p negatı́vja, vagy ellentettje, mı́g p−1 a p osztály reciproka, vagy inverze. Látható,
hogy negatı́vja minden racionális számnak van, de reciproka csak a nullától különbözőknek. Ha p = (a, b) és q = (c, d) tetszőleges racionális számok, akkor ezek összege alatt a (15) p + q = (a · d + b · c, b · d) racionális számot értjük. Észrevehetjük, hogy az összeget úgy kell képezni, hogy a két racionális számot egy-egy törttel reprezentáljuk, majd ezeket a törteket ”közös nevezőre hozzuk”, ami azt jelenti, hogy mindkét törtnek az osztályában keresünk egy-egy olyan törtet, melyeknek már azonos a nevezőjük. Végül az immár közös nevezőjű törtekből képezzük azt a törtet, melynek számlálója a két számláló összege, nevezője pedig a közös nevező. Ennek a törtnek az osztálya lesz a p + q racionális szám. A dolog leı́rva bonyolultabbnak tűnik, mint ahogyan ezt rutinból a hétköznapi számolás során elvégezzük Természetesen azt
is nagyon egyszerű megmutatni, hogy a p + q racionális szám nem függ a p-t, illetve q-t reprezentáló törtektől, csak ezen törtek osztályaitól. A szorzás értelmezése következik. Ha p = (a, b) és q = (c, d) tetszőleges racionális számok, akkor ezek összege alatt a p · q = (a · b, c · d)  (16)  racionális számot értjük. Itt ismét felismerhetjük a törtek szorzásának a hétköznapi gyakorlatból ismert szabályát: a két törtből azt a törtet képezzük, melynek számlálója a számlálók, nevezője pedig a nevezők szorzata lesz. Az ı́gy kapott tört által reprezentált osztály lesz a két tört által reprezentált racionális számok szorzata. A racionális számok összeadásával és szorzásával kapcsolatban ugyanazokat az elnevezéseket és jelöléseket használjuk, mint az egész számok esetében. Most már csak azt kellene tudni, hogy vajon melyek azok a
racionális számok, amelyek egész számoknak ”tekinthetők”, vagyis a Q mely részhalmazát azonosı́thatjuk Z-vel, és milyen módon történik ez az azonosı́tás. Ám a válasz egyszerű: ha az (a, b) párokat törteknek fogjuk fel, akkor nyilván azoknak a pároknak az osztályai fogják az egész számok szerepét játszani, amelyeknek a nevezője 1. Valóban, jelölje Z0 az ilyen osztályok halmazát, tehát azokét, amelyek tartalmaznak (a, 1) alakú párt valamilyen a egész számmal Világos, hogy egy ilyen osztály pontosan az összes (a · b, b) alakú párokból áll, ahol b 6= 0 egész szám. Ha ezt az osztályt az a egész számmal ”azonosı́tjuk”, akkor azt tapasztaljuk, hogy az a ↔ (a, 1) azonosı́tás révén Z0 -ban minden ugyanúgy ”működik”, mint Z-ben: a számunkra egyedül fontos ismertetőjegyek, vagyis az alapműveletekkel kapcsolatos viselkedés alapján nem tudjuk
megkülönböztetni     2.7 A racionális számok  43  Z-t Z0 -tól. Jogos tehát a Z0 struktúrát ugyanúgy a Z egy másik ”megnyilvánulásának” tekinteni, mint tettük ezt a természetes számokról az egész számokra való áttérés során. Így mostantól világos, hogy mit kell értenünk az N ⊆ Z ⊆ Q tartalmazáson: azt, hogy Q-nak van egy olyan részhalmaza, mely a számolással kapcsolatban ugyanúgy viselkedik, mint Z, s a Z-nek van egy olyan részhalmaza, mely a számolással kapcsolatban ugyanúgy viselkedik, mint N. Megjegyezzük, hogy valójában a szigorúbb N ⊂ Z ⊂ Q tartalmazás érvényes, melynek első részét már fentebb láttuk, a másodikhoz pedig elég annyit megjegyezni, hogy könnyen látható módon az (1, 2) pár osztálya nincs benne Z0 -ban, tehát nem egész szám, bár nyilván racionális. A két alapművelet mellett természetesen értelmezzük a kivonást is Q-ban,
ugyanúgy, mint Z-ben: a p és q racionális számok p−q különbsége alatt a p+(−q) racionális számot értjük, s az ezzel kapcsolatos elnevezések megegyeznek az egész számok esetében használtakkal. Térjünk most vissza arra a problémára, mely a racionális számok bevezetését motiválta, vagyis a (14) egyenletre, amelyet most p·x=q  (17)  alakban ı́runk fel. Itt feltételezzük, hogy p, q tetszőleges racionális számok, de q 6= 0. Könnyen ellenőrizhetjük hogy ennek az egyenletnek a racionális számok halmazában az egyetlen megoldása a q · p−1 szám. Így az egyenlet a racionális számok halmazában a p 6= 0 feltétel mellett mindig egyértelműen megoldható. A q · p−1 racionális számot a q és p hányadosának nevezzük, q-t osztandónak, p-t pedig osztónak. Az ı́gy értelmezett új művelet neve osztás A hányadost pq alakban is felı́rhatjuk. A fentiek alapján az is világos,
hogy minden racionális szám felı́rható két Z0 -beli racionális szám, tehát két egész szám hányadosaként. Bár ez a felı́rás soha nem egyértelmű, a természetes számok prı́mtényezős felbontásáról szóló 2.71 alaptétel felhasználásával meg lehet mutatni, hogy minden 0-tól különböző racionális szám felı́rható két olyan egész szám hányadosaként, amelynél a számláló és a nevező már relatı́v prı́mek, tehát a ”tört tovább már nem egyszerűsı́thető”. Ez az alak a számlálóban és a nevezőben szereplő egész számok előjelétől eltekintve már egyértelmű. A racionális számok halmazában tehát négy művelet végezhető el lényegében korlátlanul: az összeadás, a kivonás, a szorzás és az osztás. A ”lényegében” itt arra utal, hogy nullával nem lehet osztani. Ezek az úgynevezett alapműveletek Mivel a kivonás
tulajdonképpen összeadás, az osztás pedig szorzás, ezért az összeadás és a szorzás az elsődlegesek, ezek felsorolt alaptulajdonságaiból a kivonás és osztás tulajdonságai is mind következnek. Javasoljuk, hogy az Olvasó saját tapasztalataiból, korábbi tanulmányai alapján igyekezzen minél több ilyen aritmetikai azonosságot önállóan összegyűjteni, s kı́sérelje meg azokat a fentebb mutatott módszerekkel bebizonyı́tani. Néhány szót kell még szólnunk a racionális számok körében az egyenlőtlenségek értelmezéséről. Akkor mondjuk, hogy a p racionális szám pozitı́v, ha     44  A számfogalom  osztályában van olyan (m, n) pár, melynél m · n > 0. Könnyű látni, hogy ha ez teljesül, akkor a p osztályában minden pár ilyen tulajdonságú, s az is egyszerűen következik, hogy ha p egész szám, akkor ebben az értelemben pontosan akkor pozitı́v, ha a korábbi,
egész számokra vonatkozó értelemben pozitı́v volt. Ennek a fogalomnak a birtokában a ”negatı́v”, ”nem negatı́v”, ”nem pozitı́v” fogalmak, valamint a ”kisebb”, ”kisebb, vagy egyenlő”, ”nagyobb”, ”nagyobb, vagy egyenlő ” fogalmak értelmezése ugyanúgy történik, mint az egész számok esetében, s a vonatkozó tulajdonságok is érvényben maradnak. Célszerű lesz összefoglalni a racionális számok halmazában az eddig értelmezett két alapművelet, valamint a ”kisebb, vagy egyenlő” reláció mindazon alaptulajdonságait, melyek a racionális számokkal és az egyenlőtlenségekkel való számolás legfontosabb szabályait rögzı́tik. Először a műveleti szabályok következnek. 2.72 Tétel Bármely p, q, r racionális számokra érvényesek a következők: (Q1) p + q = q + p , (Q2) p + (q + r) = (p + q) + r , (Q3) p + 0 = p , (Q4) p + (−p) = 0 , (Q5) p · q = q · p , (Q6)
p · (q · r) = (p · q) · r , (Q7) p · 1 = p , (Q8) p · p−1 = 1, ha p 6= 0 , (Q9) p · (q + r) = p · q + p · r . Az alábbi tételben a ”kisebb, vagy egyenlő” reláció értelmében vett nagyság szerinti rendezés alapazonosságai következnek. 2.73 Tétel Bármely p, q, r racionális számok esetén érvényesek a következők: (Q10) p ≤ p , (Q11) ha p ≤ q és q ≤ p, akkor p = q , (Q12) ha p ≤ q és q ≤ r, akkor p ≤ r , (Q13) p ≤ q, vagy q ≤ p . Végül a következő tétel a műveletek és a rendezés kapcsolatát rögzı́ti. 2.74 Tétel Bármely p, q, r racionális számok esetén érvényesek a következők:     2.7 A racionális számok  45  (Q14) ha p ≤ q, akkor p + r ≤ q + r , (Q15) ha p ≤ q és 0 ≤ r, akkor p · r ≤ q · r . A tételek mindegyike egyszerű számolással, a korábbiak mintájára bizonyı́tható. A részleteket az Olvasóra bı́zzuk Látjuk, hogy a felı́rt
azonosságok között sok szerepelt már korábban, a természetes számok, illetve az egész számok halmazában, ám ezek mindegyike a korábbi számkörök egyikében sem teljesült. Azt is meg kell jegyeznünk, hogy ezekből a tulajdonságokból következik a 0, az 1, a −p és a p−1 speciális elemek egyértelműsége, tehát a felı́rt tulajdonságuk ezeket az elemeket egyértelműen jellemzi. Az is világos, hogy p és −p, valamint p és p−1 szimmetrikus szerepet játszanak: −p negatı́vja p, és p−1 reciproka p. A felsorolt tulajdonságrendszer egy axiómarendszernek is tekinthető abban az értelemben, hogy ha adott egy halmaz, melynek elemei között értelmezett egy x+y ”összeadás”, egy x·y ”szorzás”, valamint egy x ≤ y ”kisebb, vagy egyenlő” rendezés, melyek a 0, a −x, az 1 és az x−1 alkalmas definı́ciójával a fenti 15 tulajdonságot teljesı́tik, akkor ezt a halmazt algebrai
értelemben rendezett testnek nevezzük. Az első 9 tulajdonsággal rendelkező struktúra az úgynevezett test, mı́g az ezt követő 4 tulajdonság az úgynevezett lineárisan rendezett halmazt jellemzi. Ha egy test egyben lineárisan rendezett halmaz is, továbbá teljesül az utolsó két tulajdonság, akkor az illető halmaz rendezett test. Ezek szerint a racionális számok halmaza a fentiekben értelmezett műveletekkel és rendezéssel egy példa arra az alapvető algebrai fogalomra, amelyet úgy nevezünk, hogy rendezett test. Könnyű látni, hogy a korábban értelmezett N, a természetes számok halmaza, valamint Z, az egész számok halmaza közül egyik sem rendezett test, hiszen ezekben a struktúrákban a fenti tulajdonságok közül számos nem teljesül. Felvetődik a kérdés, hogy vajon a ”rendezett test” fogalma jellemzi-e a racionális számok halmazát? Másszóval, van-e a racionális számok
halmazától lényegesen különböző rendezett test? Anélkül, hogy ezen a ponton a ”lényegesen különböző” jelentésének magyarázatába bonyolódnánk, megjegyezzük, hogy a későbbiekben látni fogjuk: vannak a racionális számok halmazától lényegesen különböző rendezett testek, melyek közül az egyik éppen a számunkra alapvető fontosságú valós számok halmaza lesz. Természetesen a ”kisebb, vagy egyenlő” rendezés tulajdonságaiból a ”kisebb” rendezés tulajdonságai is könnyen következnek, melyek közül néhányat az alábbi tételben felsorolunk. 2.75 Tétel Bármely p, q, r racionális számok esetén érvényesek a következők: (i) p ≮ p , (ii) ha p < q, akkor q ≮ p , (iii) ha p < q és q < r, akkor p < r , (iv) p = q, p < q, és q < p közül pontosan az egyik teljesül ,     46  A számfogalom  (v) ha p < q, akkor p + r < q + r , (vi)
ha p < q és 0 < r, akkor p · r < q · r . A fenti, és hasonló állı́tások bizonyı́tásánál arra kell törekednünk, hogy csupán a rendezett test felsorolt 15 axiómáját használjuk, azt sose, hogy egy racionális szám valójában micsoda. Például az első állı́tás bizonyı́tása a következő módon történhet: indirekt, tételezzük fel, hogy valamely p racionális szám esetén p < p. Definı́ció szerint ez azt jelenti, hogy p ≤ p, de p 6= p, ami máris ellentmondás Egy másik alkalmazásként bebizonyı́tjuk a következő  nem túlságosan meglepő  tételt. 2.76 Tétel Bármely p 6= 0 racionális szám esetén p · p > 0 Bizonyı́tás. Először azt igazoljuk, hogy tetszőleges p racionális szám esetén fennáll −p = (−1) · p. Érdemes kissé belegondolni ennek az állı́tásnak a jelentésébe Ne feledjük, hogy csak a 15 axiómát akarjuk használni, illetve
azoknak esetleg már bebizonyı́tott következményeit Az axiómák a −p elemet azzal a tulajdonsággal jellemzik, hogy p-hez hozzáadva az eredmény 0 lesz. A (−1) · p látszólag egészen más dolog. Ha valamiről azt akarjuk bebizonyı́tani, hogy −pvel egyenlő, akkor azt a valamit p-hez hozzá kell adni, s az eredményről kimutatni, hogy az 0 Itt persze erősen felhasználjuk a −p egyértelműségét: nincs semmi más, amit p-hez hozzáadva eredményül 0-t kapnánk. Számı́tsuk ki tehát a p+(−1)·p összeget. Ha eredményül 0-t kapunk, azzal az állı́tásunk bizonyı́tást nyert. A (Q5), (Q7) és (Q9) axiómák miatt a következő módon számolhatunk: ¡ ¢ p + (−1) · p = 1 · p + (−1) · p = 1 + (−1) · p . Ám −1 éppen az 1 negatı́vja, s ı́gy a (Q4) axióma alapján 1 + (−1) = 0, vagyis a fenti számı́tás alapján p + (−1) · p = 0 · p . Már csak azt kellene tudnunk, hogy minden p
racionális szám esetén 0 · p = 0. Ez önmagában is fontos tudnivaló, de az axiómák között nem szerepel, ı́gy bizonyára azokból levezethető. Ismét gondoljunk arra, hogy a 0-t pontosan az a tulajdonsága definiálja, hogy bármihez hozzáadva az a valami nem változik. Tehát ki kellene számolnunk a 0 · p + q összeget, ahol q tetszőleges racionális szám. Ha az eredmény 0, akkor ennek a részállı́tásnak is, és az eredeti állı́tásnak is befejeztük a bizonyı́tását. A következő számı́tást végezhetjük el: 0 · p + q = (0 + 0) · p + q = 0 · p + 0 · p + q , ahol az első lépésben a 0-t definiáló 0 = 0+0 tulajdonságot, a másodikban pedig a (Q9) axiómát használtuk fel. Ezek után az előbbi egyenlőség első és utolsó részéhez adjuk hozzá a 0 · p szám negatı́vját, −(0 · p)-t. Azt kapjuk, hogy −(0 · p) + (0 · p + q) = −(0 · p) + (0 · p + 0 · p + q) .     A
racionális számok hatványozása  47  Most a csoportosı́thatóságról szóló (Q2) axiómát kell használnunk: ¡ ¢ ¡ ¢ (−0 · p) + 0 · p + q = (−0 · p) + 0 · p + (0 · p + q) , amiből a (Q3) és (Q4) axióma alapján állı́tásunk következik: q = 0·p+q, ugyanis azt kaptuk, hogy a 0 · p racionális számot bármely q racionális számhoz hozzáadva eredményül q-t kapunk, ı́gy ez a szám csak 0 lehet. Térjünk vissza ezek után eredeti állı́tásunkhoz: ha p 6= 0 racionális szám, akkor p · p > 0. Tudjuk a 275 tétel (iv) részéből, hogy p = 0, p > 0 és p < 0 közül pontosan az egyik teljesül. Esetünkben p = 0 ki van zárva, ı́gy csak a másik két lehetőség marad. Ha p > 0, akkor a 275 tétel (vi) része miatt p · p > 0 teljesül, és készen vagyunk. Ha viszont p < 0, akkor −p > 0 Valóban, −p = 0 lehetetlen, mert akkor p = 0 volna, −p < 0 esetén pedig 0 = p
+ (−p) < 0 következne a 2.75 tétel (v) része miatt, ami ugyancsak ki van zárva. Tehát −p > 0, s az előbb igazoltak miatt (−p) · (−p) > 0 Ugyanakkor (−p) · (−p) = (−1) · (−1) · p · p, ı́gy elég azt igazolnunk, hogy (−1) · (−1) = 1. A fentiekben láttuk, hogy (−1) · p = −p teljesül minden p racionális szám esetén, másszóval a −1-el való szorzás a szám negatı́vját adja. Ezt a −1 számra alkalmazva éppen azt kapjuk, hogy (−1) · (−1) a −1 negatı́vja, ami nyilván 1, s ezzel az állı́tásunkat teljes egészében bebizonyı́tottuk.  2.8  A racionális számok hatványozása  Az egész számok halmazában a hatványozás tulajdonképpen ismételt szorzást jelentett: egy olyan többtényezős szorzatot, melynek minden tényezője ugyanaz, röviden hatvány-alakban is felı́rhatunk. Ilyenkor tehát az alap tetszőleges egész szám lehet, a kitevő pedig természetes
szám, amely nullától különböző esetben a tényezők számát jelenti, mı́g a nulla kitevő esetében  nullától különböző alap mellett  az a0 = 1 megállapodással élünk. A 0nak nem értelmezzük 0 kitevőjű hatványát Felvetődik a kérdés, hogy vajon a p q hatvány értelmezhető-e ”normálisan” akkor, ha p, q racionális számok? A ”normálisan” jelző olyasmit jelent, hogy egyrészt, ha p egész szám, q pedig természetes szám, akkor visszakapjuk a korábban értelmezett hatvány-jelentést, másrészt, lehetőség szerint érvényben maradjanak a 2.23 tételben látott azonosságok. Racionális számok pozitı́v egész kitevőjű hatványai természetesen továbbra is ismételt szorzásként értelmezendők, s a nullától különböző racionális számok nulladik hatványa alatt változatlanul 1-et fogunk érteni. Most kı́séreljük meg nullától
különböző racionális számok negatı́v egész kitevőjű hatványait értelmezni! Ha a 2.23 tétel első azonosságát a negatı́v hatványokra is meg akarjuk tartani, akkor egy a 6= 0 racionális szám esetén a−1 -nek teljesı́teni kell az a−1 · a = a−1 · a1 = a−1+1 = a0 = 1     48  A számfogalom  összefüggést, ı́gy a−1 csak a reciproka lehet, ami teljesen összhangban van a reciprok korábban már bevezetett jelölésével. Másrészt, a 223 tétel második azonosságának fennállása alapján bármely n pozitı́v egész szám esetén ¡ ¢n ¡ ¢−1 a−n = a(−1)·n = a−1 = an kell, hogy teljesüljön, ezért, összefoglalva, a nullától különböző racionális számok negatı́v egész kitevőjű hatványait az ¢n ¡ ¢−1 ¡ a−n = a−1 = an  (18)  módon értelmezzük. Másszóval, a negatı́v egész kitevőjű hatvány a megfelelő pozitı́v egész kitevőjű
hatvány reciprokát jelenti. Könnyen ellenőrizhető, hogy ı́gy érvényben maradnak a 2.23 tételben szereplő összefüggések A következő lépés a nem feltétlenül egész kitevőjű hatvány értelmezése. Legyen például a = −1, és vizsgáljuk meg, hogy milyen ”értelmes” jelentést 1 tudnánk tulajdonı́tani a (−1) 2 hatványnak. Ha elvárjuk, hogy a 223 tétel első azonossága érvényben maradjon, akkor bármilyen racionális számot is jelentsen 1 (−1) 2 , teljesülnie kell a 1  1  1  1  (−1) 2 · (−1) 2 = (−1) 2 + 2 = (−1)1 = −1 1  egyenlőségnek, azaz a (−1) 2 egy olyan 0 különböző szám, amelynek a négyzete −1. Márpedig a 276 tételben láttuk, hogy minden 0-tól különböző racionális szám négyzete pozitı́v. Az 1 nyilván pozitı́v, hiszen 1 = 1 · 1, ı́gy −1 negatı́v, vagyis nincs olyan 0-tól különböző racionális szám, amely a fenti
egyenlőséget kielégı́tené. Ez elég sajnálatos, hiszen azt mutatja, hogy már egy egészen egyszerű esetben is lehetetlen az 21 kitevőjű hatvány olyan értelmezése, mely összhangban van a 2.23 tétel jól megszokott első azonosságával Vajon az a tény okozza itt a problémát, hogy az alap negatı́v? A fenti érvelés nyilván valami ilyesmit sugall, ı́gy tegyünk egy újabb kı́sérletet, s próbáljuk meg kitalálni, hogy 1 milyen racionális számot kellene jelenteni mondjuk a 2 2 hatványnak úgy, hogy 2.23 tétel első azonossága érvényben maradjon A fenti számı́tást −1 helyett 1 2-vel elvégezve azt kapjuk, hogy 2 2 egy olyan racionális számot kellene, hogy jelentsen, amelynek négyzete 2. Ám ilyen racionális szám nem létezik, amint azt a következő tétel mutatja. 2.81 Tétel Nem létezik olyan racionális szám, melynek négyzete 2 Bizonyı́tás. A bizonyı́tást indirekt
végezzük el: tegyük fel, hogy van olyan p racionális szám, hogy p2 = 2. Ekkor p nyilván 0-tól különböző, s mivel p-nek és −p-nek ugyanannyi a négyzete, azt is feltehetjük, hogy p pozitı́v. Fentebb láttuk, hogy p felı́rható két egész szám hányadosaként: p=  m , n     2.8 A racionális számok hatványozása  49  ahol azt is feltehetjük, hogy m és n pozitı́vak, továbbá ez a felı́rás már nem egyszerűsı́thető, azaz, az m és n természetes számok relatı́v prı́mek. Ekkor azt kapjuk, hogy p · n = m, majd négyzetre emeléssel 2 n2 = m 2 , hiszen a feltevés szerint p2 = 2. A bal oldalon egy páros szám áll, ı́gy m2 osztható 2-vel, ami csak úgy lehet, hogy m páros: m = 2 k, valamilyen k természetes számmal. Ezt visszahelyettesı́tve 2 n2 = (2 k)2 = 4 k 2 adódik, amiből n2 = 2 k 2 következik, s az előbbi gondolatmenet megismétlésével azt kapjuk, hogy az n számnak is
párosnak kell lenni, ami lehetetlen, hiszen a feltevés szerint m és n relatı́v prı́mek. Ez az ellentmondás azt mutatja, hogy a kiindulási feltevés hamis, vagyis nem létezik olyan racionális szám, amelynek a négyzete 2. A fenti próbálkozásból látható, hogy például egy p racionális szám 21 -ik hatványa egy olyan szám kellene, hogy legyen, amelynek négyzete p. Vagyis az 21 -ik hatvány tulajdonképpen a négyzetgyök alapvető tulajdonságával kellene, hogy rendelkezzen. Így talán már nem olyan sajnálatos, hogy a −1-hez nem találtunk ilyen számot, de az, hogy a 2-nek sincs racionális négyzetgyöke, az már kissé lehangoló. Annyit mindenesetre láthatunk, hogy eleinte csak olyan hatványkifejezések értelmezésével érdemes próbálkozni, amelyeknél az alap pozitı́v racionális szám. Másrészt, várható, hogy ha az n1 alakú kitevőkre a racionális számok valamilyen
bővı́tésével ki tudnának terjeszteni a hatványozást, akkor ebből már tovább tudnánk lépni tetszőleges racionális kitevőre. Valóban, ha a egy olyan újfajta ”szám”, amelynek n1 -edik hatványát már sikerült értelmes módon definiálni, akkor az m n -edik hatvány értelmezéséhez az 1 m =m· n n azonosság, valamint az elvárható 2.23 tételben szereplő második egyenlőség figyelembevételével az ¡ 1 ¢m m a n = an természetesnek látszó definı́ciót kell alkalmazni. Tisztázódni látszik tehát az alapvető kérdés: hogyan lehetne a racionális számok halmazát úgy bővı́teni, hogy az új számkörben az összeadás és a szorzás értelmezve legyen a (Q1)(Q9) tulajdonságokkal, valamint az új számokat rendezni lehessen a (Q10)(Q15) tulajdonságokkal, továbbá ebben az új számkörben legalább a pozitı́vnak számı́tó számoknak legyen n-edik gyöke minden n
pozitı́v természetes szám esetén, ahol természetesen ”n-edik gyök” alatt egy olyan számot értünk, amelynek n-edik hatványa az adott szám. Kissé hivatalosabb nyelvezetet használva     50  A számfogalom  akkor dőlhetnénk nyugodtan hátra, ha valahogyan ki tudnánk mutatni egy olyan rendezett test létezését, amelyben minden pozitı́v elemnek létezik n-edik gyöke, tetszőleges n pozitı́v természetes szám esetén. Azt már melléktermékként várjuk el, hogy amennyiben sikerülne egy ilyen gyökvonást értelmezni, akkor ez, és a belőle a fenti módon származtatható racionális kitevőjű hatványozás lehetőleg rendelkezzen a hatványozás 2.23 és 261 tételekben szereplő megszokott tulajdonságaival Pillanatnyilag a következő tétel érvényes, melynek bizonyı́tása a megadott definı́ciók alapján egyszerű számolás. 2.82 Tétel Bármely a, b nullától különböző
racionális számok és m, n egész számok esetén érvényesek a következők: (i) am+n = am · an , ¡ ¢n (ii) am = am·n , (iii) (a · b)m = am · bm . Nos, programunk megvalósı́tásához nyilván korábbi tapasztalataink alapján kezdünk hozzá. Már kétszer bevált az a módszer, hogy a meglévő számhalmaz elemeiből rendezett párokat képeztünk, azokból alkalmas módon osztályokat, majd az új számkört ezek az osztályok alkották az egyenlőség, a műveletek és a rendezés alkalmas értelmezésével. Sajnos azonban elérkeztünk ezen módszer alkalmazhatóságának korlátaihoz: a racionális számok halmazából nem lehet ezekkel a tisztán algebrai módszerekkel azt az új számfogalmat megalkotni, amely elvárásainknak megfelel. Természetesen a valós szám fogalmáról van szó, amely a modern matematikai analı́zis legfontosabb eszköze. Ennek a fogalomnak a megalkotása és
megértése a következő feladatunk.  2.9  A valós számok halmaza  A valós számok halmazának értelmezése előtt tisztáznunk kell, hogy vajon milyen intuitı́v fogalmunk van a valós számról: milyen kép él bennünk róla és milyen elvárásaink vannak vele kapcsolatban. Tudjuk, hogy mindennapi számolásaink során szinte kizárólag racionális számokkal van dolgunk, a számı́tógépek is racionális számokat képesek ábrázolni, s a hétköznapi céljainknak  úgy tűnik  ez a fogalom tökéletesen elegendő. Ez az elképzelés azonban téves: már a legelemibb geometriai problémákkal kapcsolatban is fellépnek olyan ”számok”, amelyek nem racionálisak, tehát  hétköznapi nyelven szólva  nem fejezhetők ki két egész szám hányadosaként. Például a Pitagorasz–tétel szerint egy egységnyi befogójú egyenlő szárú derékszögű háromszög átfogójának hosszát
egy olyan ”számmal” lehet kifejezni, amelynek négyzete 2, s a fentiekben láttuk, hogy ilyen racionális szám nincs. Hasonló problémák lépnek fel egy egységsugarú kör kerületének, vagy területének kifejezésekor: ez racionális számokkal nem lehetséges. Tehát jelen tudásunk szerint egy egységnyi befogójú egyenlő szárú derékszögű háromszög átfogójának nincs hossza, márpedig egy     2.9 A valós számok halmaza  51  ilyen szakaszt teljesen elemi módon tudunk szerkeszteni. Ha az összes szerkeszthető szakaszokat úgy képzeljük el, hogy ezek egy egyenesen, az úgynevezett számegyenesen helyezkednek el, mégpedig olyan módon, hogy egyik végpontjuk a számegyenes egy rögzı́tett pontjában, az origóban van, a másik pedig az egyenes egy pontjával esik egybe, akkor tehát ennek az egyenesnek vannak olyan pontjai, amelyek semmilyen számnak nem feleltethetők meg. Az egyenesen
természetesen önkényesen kijelölhetünk egy origótól különböző pontot, s az origót ezzel a ponttal összekötő szakaszt egységszakasznak nevezve ennek az origótól különböző végpontja felelne meg az 1 racionális számnak. Az egységszakasz kijelölésével természetesen egy irányı́tást is rögzı́tenénk: annak a félegyenesnek az iránya számı́tana pozitı́vnak, amelyen az egységszakasz origótól különböző végpontja fekszik, a másik pedig negatı́vnak. Az origót a 0-val azonosı́tva, majd az egységszakaszt mindkét irányban tetszőlegesen sokszor egymás után felmérve megkapnánk az egész számokat reprezentáló pontokat. Az m n racionális számnak megfelelő szakasz ugyancsak könnyen szerkeszthető: ha például m, n pozitı́v egész számok, akkor először az egységszakaszt n egyenlő részre osztjuk, majd ezekből a részekből m darabot egymás után
felmérünk a pozitı́v irányban. Hasonlóan kapjuk a negatı́v racionális számoknak megfelelő pontokat. Ezzel a racionális számoknak megfeleltettük a számegyenes bizonyos pontjait, de korántsem az összeset, hiszen láttuk, hogy az egységnyi befogójú egyenlő szárú derékszögű háromszög átfogójának megfelelő szakaszt ha az origóból kiindı́tjuk, akkor annak másik végpontja nem olyan pont, amely valamilyen racionális számnak felel meg. Ez azt mutatja, hogy bármilyen sokan vannak a racionális számok és bármilyen sűrűn helyezkednek el a nekik megfelelő pontok a számegyenesen, azért mégis ”kevesebben” vannak, mint a számegyenes pontjai, hiszen nem tudják teljesen kitölteni az egyenest. Elég értelmes gondolatnak tűnik az az elképzelés, hogy próbáljunk meg az egyenes azon pontjainak is valamilyen ”szám-jelentést” tulajdonı́tani, amelyek nem felelnek meg semmilyen
racionális számnak. Másszóval, próbáljuk meg a racionális számok halmazát olyan újfajta ”számokkal” bővı́teni, amelyeknek megfelelő pontok már teljesen kitöltik az egyenest. Persze az is fontos elvárás, hogy ezekkel az újfajta számokkal legalább ugyanazt lehessen csinálni, amit a racionális számokkal lehetett, lehetőleg ugyanazon szabályok szerint. Titkon még azt is reméljük, hogy talán egy ilyen bővı́téssel a hatványozásnak a racionális számok halmazában tapasztalt hiányosságait is sikerül kiküszöbölni. De vajon mik legyenek ezek az új számok? Teljesen értelmetlen lenne erre azt rávágni, hogy ”az irracionális számok!”, hiszen számunkra pillanatnyilag kizárólag a racionális számok jelentik a ”szám” fogalmát, másfajta szám nincs. Bevezetünk néhány jelölést és elnevezést. Ha p, q racionális számok, és p ≤ q, akkor legyen ]p, q[= {x|x
∈ Q, p < x < q} , [p, q] = {x|x ∈ Q, p ≤ x ≤ q} , [p, q[= {x|x ∈ Q, p ≤ x < q} , ]p, q] = {x|x ∈ Q, p < x ≤ q} .     52  A számfogalom  A ]p, q[, [p, q], [p, q[, ]p, q] halmazokat rendre nyı́lt, zárt, balról zárt, jobbról nyı́lt, illetve balról nyı́lt, jobbról zárt intervallumnak nevezzük. A két utolsót szokás félig nyı́lt, illetve félig zárt intervallumnak is nevezni. A p, q racionális számokat az illető intervallumok baloldali, illetve jobboldali végpontjának nevezzük. Bármely p racionális szám esetén legyen továbbá ] − ∞, p[= {x|x ∈ Q, x < p} , ] − ∞, p] = {x|x ∈ Q, x ≤ p} , ]p, ∞[= {x|x ∈ Q, p < x} , [p, ∞[= {x|x ∈ Q, p ≤ x} , ] − ∞, ∞[= Q . Ezeket a halmazokat végtelen intervallumnak nevezzük, melyeknek p értelemszerűen a bal-, illetve jobboldali végpontja. Például a [p, p] intervallum a p pontból álló egypontos halmaz, mı́g a [p, p[,
]p, p] és ]p, p[ intervallumok mindegyike az üres halmaz. Ezeknek a definı́cióknak nyilván minden rendezett halmazban van értelmük. Legyen ezután A a racionális számok halmazának egy olyan valódi, nem üres részhalmaza, mely rendelkezik azzal a tulajdonsággal, hogy ha q az A-hoz tartozik és p < q, akkor p is az A-hoz tartozik. Az A halmazt szeletnek nevezzük, ha nincs legnagyobb eleme. Például tetszőleges q racionális szám esetén a ] − ∞, q[ végtelen intervallum nyilvánvalóan szelet. Ha a racionális számok halmazát úgy képzeljük el, amint azt a szakasz elején emlı́tettük, hogy tehát egy egyenes bizonyos pontjainak a halmaza, akkor a szeletre úgy gondolhatunk, hogy ezt az egyenest valahol elvágjuk, és azokat a racionális számokat tekintjük, amelyek a vágástól balra esnek. Ha az a pont, ahol az egyenest elvágtuk éppen megfelel egy racionális számnak, akkor kapjuk az olyan szeleteket,
amelyeket az imént példaként emlı́tettünk: a ] − ∞, q[ végtelen intervallumokat. Természetesen felvetődik a kérdés: vannak-e más tı́pusú szeletek a racionális számok halmazában? Az elvágott egyenesre gondolva válaszunk nyilvánvalóan igenlő: ha az egyenest egy olyan pontban vágjuk el, amely nem felel meg racionális számnak, akkor a kapott szeletet nem lehet felı́rni semmilyen ] − ∞, q[ végtelen intervallum alakjában, hiszen  szemléletesen szólva  nincsen jobboldali végpontja. A geometriai hasonlattól elszakadva tekintsük a racionális számok halmazának azon A részhalmazát, mely tartalmazza az összes negatı́v racionális számot, a 0-t, valamint mindazon racionális számokat, amelyeknek a négyzete kisebb, mint 2. Jelekben A = {p |p ∈ Q, és p ≤ 0, vagy p2 < 2} . Erről az A halmazról némi fáradsággal ki tudjuk mutatni, hogy ez egy szelet. Világos, hogy A nem üres halmaz,
hiszen például az 1 A-hoz tartozik. Az is nyilvánvaló, hogy A nem az egész Q, hiszen például a 2 nem tartozik A-hoz. Ha q az A-hoz tartozik és p < q, akkor p ≤ 0 esetén nyilván p is A-hoz tartozik, p > 0 esetén pedig könnyű belátni a szigorú egyenlőtlenség fentebb részletezett     2.9 A valós számok halmaza  53  tulajdonságai alapján, hogy q 2 < 2 miatt p2 < 2 is fennáll. Már csak azt kellene belátnunk, hogy A-nak nincs legnagyobb eleme. Anélkül, hogy a részletekbe belemennénk megjegyezzük, hogy azt lehet megmutatni, hogy ha A-nak lenne legnagyobb eleme, akkor annak a négyzete szükségképpen 2 lenne, ám ilyen racionális szám nem létezik. Ugyanı́gy lehet azt is igazolni, hogy ha lenne olyan q racionális szám, hogy A =] − ∞, q[ teljesülne, akkor a q racionális számnak a négyzete ugyancsak 2 kellene, hogy legyen. Így ez nem állhat fenn, vagyis A egy olyan szelet, ami nem
ı́rható fel semmilyen q racionális számmal ] − ∞, q[ végtelen intervallumként. A racionális számok halmazában tehát kétfajta szeletet különböztethetünk meg: vannak olyan szeletek, amelyek egy racionális szám által vannak meghatározva abban az értelemben, hogy ] − ∞, q[ alakban ı́rhatók fel valamilyen q racionális számmal. Persze, az ilyen szeletek egyértelműen meghatározzák az illető racionális számot, hiszen ha ] − ∞, q[=] − ∞, r[ teljesül valamilyen q, r racionális számokra, akkor nyilván q = r. Másrészt, vannak olyan szeletek, amelyeket nem határoz meg semmilyen racionális szám ilyen értelemben, vagy azt is mondhatjuk, hogy vannak olyan szeletek, amelyek nem határoznak meg semmilyen racionális számot ilyen módon. Röviden úgy fogalmazhatjuk meg ezt a jelenséget, hogy a racionális számok halmazában vannak ”racionális” szeletek, és vannak ”nem racionális”
szeletek. Ez a felismerés már közvetlenül elvezet ahhoz a gondolathoz, amely lehetővé teszi a racionális számok halmazának bővitését, s a valós számok halmazának bevezetését. A gondolat R Dedekind6 német matematikustól származik, s az alábbiakban a technikai részletek tárgyalásának mellőzésével röviden ismertetjük. Jelölje R a racionális számok összes szeleteinek halmazát. Célunk most az, hogy ezen a halmazon úgy értelmezzük az összeadás és a szorzás műveleteit, valamint a rendezést, hogy a (Q1)-(Q15) tulajdonságok teljesüljenek, másszóval R rendezett test legyen. Az is célunk, hogy ebben az új rendezett testben ki tudjunk jelölni egy olyan részhalmazt, ami valamilyen értelemben azonosnak tekinthető a racionális számok rendezett testével. Végül a legfontosabb kı́vánalom az, hogy ebben az új rendezett testben legalábbis pozitı́v alap esetén a racionális
kitevőjű hatványozás korlátlanul elvégezhető legyen, amihez a fentiekben mondottak szerint elegendőnek látszik azt elérni, hogy minden pozitı́v számnak minden n pozitı́v egész kitevő esetén legyen ”n-edik gyöke”. Először a rendezést értelmezzük R-ben. Akkor mondjuk, hogy az A szelet kisebb, vagy egyenlő, mint a B szelet, ha A ⊆ B. Ezt a tényt A ≤ B módon fogjuk jelölni. Egyszerű számolással meg lehet mutatni, hogy ez a rendezés teljesı́ti a (Q10)-(Q13) tulajdonságokat. A ”kisebb, vagy egyenlő” fogalmából a korábban alkalmazott nyilvánvaló módszerrel lehet bevezetni a ”kisebb”, ”nagyobb” és ”nagyobb, vagy egyenlő” fogalmakat, melyekkel kapcsolatban a korábbi elnevezéseket és jelöléseket fogjuk használni. A 275 tételben felsorolt 6 Richard Dedekind (1831-1916), német matematikus     54  A számfogalom  tulajdonságok érvényben maradnak, bizonyı́tásukat az
Olvasóra bı́zzuk. Ezek után a fentiekben bevezetett különböző tı́pusú intervallumokkal kapcsolatos elnevezéseket és jelöléseket is szabadon használhatjuk. Az összeadást a szeletek R halmazában a következő, kézenfekvő módon értelmezzük. Ha A és B két szelet, akkor A + B összegük alatt az összes p + q alakú racionális számok halmazát fogjuk érteni, ahol p az A-nak, q pedig a B-nek tetszőleges eleme. Természetesen erről a halmazról be kell bizonyı́tani, hogy szelet, de ez nem okoz különösebb nehézséget. A negatı́v racionális számok halmazát átmenetileg O-val fogjuk jelölni; ez fogja az új struktúrában a 0 szerepét játszani; nyilvánvalóan O szelet. Szükségünk van még az A szelet ”negatı́vjának” értelmezésére: −A-val fogjuk jelölni mindazon p racionális számok halmazát, melyekhez van olyan r > 0 racionális szám, hogy −p − r nem tartozik
A-hoz. Itt is azt kell ellenőriznünk, hogy −A szelet, de ez is egyszerű feladat. Talán kissé bonyolultabb megérteni, hogy −A-t miért ilyen körmönfont módon kell értelmezni: javasoljuk az Olvasónak, hogy egy A =] − ∞, q[ alakú ”racionális” szelet esetén ellenőrizze, hogy az ı́gy értelmezett −A pontosan a ] − ∞, −q[ szelet. Készen áll tehát minden ahhoz, hogy a rendezett test tulajdonságrendszerének (Q1)-(Q4) axiómáit ellenőrizzük a szeletek R halmazában, mégpedig úgy, hogy a 0 szerepét az O szelet, az A szelet negatı́vjának a szerepét pedig az imént értelmezett −A szelet játssza. Ezt a feladatot az Olvasóra bı́zzuk A következő lépésben először pozitı́v szeletek szorzatát értelmezzük. Ha tehát A, B > O, akkor legyen A · B az összes olyan p racionális számok halmaza, melyekhez létezik r > 0, s > 0 úgy, hogy r az A-nak, s a B-nek eleme, és p ≤
rs. Erről nem nehéz kimutatni hogy szelet Jelölje továbbá I az 1-nél kisebb racionális számok halmazát, ami nyilván ugyancsak szelet. Végül két tetszőleges szelet szorzatát a következő módon értelmezzük: legyen bármely A szelet esetén A · O = O · A = O, és tetszőleges A, B szeletek esetén   ha A < O, B < O, (−A) · (−B), A · B = −[(−A) · B], ha A < O, B > O,   −[A · (−B)], ha A > O, B < O. Ezután tetszőleges A > O szelet esetén jelölje A−1 mindazon racionális számok halmazát, melyek nem pozitı́vak, vagy reciprokuk nem tartozik A-hoz, ha pedig A < O, akkor A−1 legyen −(−A)−1 . Megmutatható, hogy I is szelet, bármely A, B szeletek esetén A · B is, valamint A 6= O esetén A−1 is. Az ı́gy értelmezett szorzással kapcsolatban az Olvasóra bı́zzuk annak igazolását, hogy fennállnak a (Q5)-(Q8) tulajdonságok, ha I játssza az 1
szerepét, az A 6= O szelet reciproka pedig az imént definiált A−1 . Továbbá ugyancsak könnyen ellenőrizhető, hogy teljesülnek a (Q9), valamint a (Q14)-(Q15) tulajdonságok. Mindezt összefoglalva kimondhatjuk a következő tételt     A valós számok teljessége  55  2.91 Tétel A racionális számok halmazában képzett szeletek R halmaza a fentiekben értelmezett műveletekkel és rendezéssel rendezett test, azaz, teljesı́ti a (Q1)-(Q15) tulajdonságokat. A továbbiakban ezt az R rendezett testet R módon jelöljük, s a valós számok halmazának nevezzük, elemeit pedig valós számoknak. Értsük meg jól a dolgot: egy valós szám nem más, mint a racionális számok halmazának egy szelete. Ezek után nagyon egyszerű válaszolni arra a kérdésre, hogy mi lesz a valós számok halmazának az a Q0 részhalmaza, amelyet a továbbiakban a racionális számok halmazával azonosnak tekintünk? Természetesen
a ] − ∞, q[ alakú szeletek halmaza, ahol q racionális szám. Ilyen módon a Q és Q0 közti azonosı́tást a q ↔]−∞, q[ megfeleltetés adja: a ]−∞, q[ alakú szeletekkkel pontosan ugyanúgy kell ”bánni”, mint a q racionális számokkal. Ez a pontos értelme annak, hogy Q ⊆ R. Másrészt az is világos, hogy valójában Q ⊂ R teljesül, hiszen a fentiekben láttuk, hogy vannak olyan szeletek, amelyek nem ] − ∞, q[ alakúak Egyetlen fontos kérdés vizsgálata maradt hátra: sikeres-e a számfogalom ilyenfajta bővı́tése abban az értelemben, hogy a valós számok halmazában lehete legalább a pozitı́v számokból akárhányadik gyököt vonni? Az ”akárhányadik” természetesen pozitı́v egész gyökkitevőt jelent. Kicsit általánosabban azt is kérdezhetjük, hogy mennyivel tud többet a valós számok halmaza a racionális számok halmazánál? Egy ilyen többlet a következő
okfejtésből kiderül. Gondoljuk el, hogy a valós számok halmazában is ugyanúgy értelmezhetjük a szelet fogalmát, mint a racionális számok halmazában, és világos, hogy minden a valós szám meghatároz egy ]−∞, a[ alakú szeletet: az összes a-nál kisebb valós számok halmazát. Nos, kiderül, hogy  ellentétben a racionális számok halmazával  a valós számok halmazában minden szelet ilyen alakú. Ez egy óriási különbség, melynek következtében például a valós számoknak megfelelő pontok teljesen kitöltik a számegyenest. A valós számok halmazának  és általában egy rendezett testnek  ezt a tulajdonságát teljességnek nevezzük A racionális számok ugyan rendezett testet alkotnak, ami egy nagyon magasrendű algebrai struktúra, hiszen számos dolgot lehet benne csinálni, ám nem teljes. Ezzel szemben a valós számok halmaza teljes rendezett test, és ebben a minőségében
egyedülálló: ha egy rendezett test teljes, akkor az ”lényegében” azonos a valós számok halmazával, attól legfeljebb csak elemeinek jelölésében különbözik. Arra a kérdésre tehát, hogy ”Mi a valós számok halmaza?” nyugodtan válaszolhatjuk, hogy ”A teljes rendezett test.” A teljesség további fontos következményeivel a következő szakaszban foglalkozunk.  2.10  A valós számok teljessége  A valós számok fentiekben értelmezett halmaza tehát rendelkezik ugyanazokkal a tulajdonságokkal, mint a racionális számok halmaza: lehet benne összeadni és szorozni ugyanazon (Q1)-(Q9) szabályok szerint, továbbá a nagyság szerinti rendezés is értelmezve van a (Q10)-(Q13) tulajdonságokkal, végül az egyenlőtlenségekkel kapcsolatos (Q14)-(Q15) alapszabályok is változatlanul     56  A számfogalom  érvényesek. Bár ennek részleteibe nem mentünk bele, de nyilvánvaló, hogy pontosan
ugyanúgy, amint a racionális számok halmazában, a valós számok halmazában is értelmezhetjük a kivonás, az osztás és a hatványozás műveleteit, továbbá a ”kisebb, vagy egyenlő” reláció mellett a további három hagyományosan használt rendezéstı́pust is ugyanúgy kell bevezetni. Az előző pontban arra is utaltunk, hogy természetesen a valós számok halmaza nem azonos a racionális számok halmazával, azt egy bizonyos, fentebb leı́rt értelemben valódi módon tartalmazza. Végül megállapı́tottuk, hogy a valós számok halmazában minden szeletet egy valós szám határoz meg, ennyiben tehát alapvetően különbözik a racionális számok halmazától. Ezt a tulajdonságot neveztük a valós számok teljességének. Felhı́vjuk a figyelmet arra, hogy a valós számok halmazának ezt a tulajdonságát nem bizonyı́tottuk be, bár az eddigi ismeretek birtokában ez nem lenne
túlságosan nehéz. Ez a tulajdonság geometriailag úgy érzékelhető, hogy a valós számok és az egyenes pontjai között olyan megfelelés áll fenn, hogy minden valós számnak megfelel az egyenes pontosan egy pontja, és az egyenes minden pontjának megfelel pontosan egy valós szám, azaz, lényegében a valós számokat ”geometriailag” úgy képzelhejük el, mint egy egyenes pontjait. Arra is rámutattunk, hogy a valós számok halmaza lényegében az egyetlen olyan struktúra, amely a felsorolt (Q1)-(Q15) tulajdonság mellett még teljes is. Mielőtt a valós számok további tulajdonságainak vizsgálatát megkezdenénk, célszerű lesz egy tételben összefoglalni mindazt, amit a valós számok halmazáról tudunk. 2.101 Tétel A valós számok R halmaza rendelkezik a következő tulajdonságokkal Bármely a, b, c valós számok esetén fennállnak a következők: (R1) a + b = b + a , (R2) a + (b + c) =
(a + b) + c , (R3) a + 0 = a , (R4) a + (−a) = 0 , (R5) a · b = b · a , (R6) a · (b · c) = (a · b) · c , (R7) a · 1 = a , (R8) a · a−1 = 1, ha a 6= 0 , (R9) a · (b + c) = a · b + a · c , (R10) a ≤ a , (R11) ha a ≤ b és b ≤ a, akkor a = b , (R12) ha a ≤ b és b ≤ c, akkor a ≤ c , (R13) a ≤ b, vagy b ≤ a ,     2.10 A valós számok teljessége  57  (R14) ha a ≤ b, akkor a + c ≤ b + c , (R15) ha a ≤ b és 0 ≤ c, akkor a · c ≤ b · c . Fennáll továbbá a következő tulajdonság: (R16) Ha A a valós számok halmazának olyan nem üres, valódi részhalmaza, mely minden elemével együtt az összes annál kisebb elemet is tartalmazza, továbbá A-nak nincs legnagyobb eleme, akkor létezik olyan a valós szám, hogy A = {x|x < a} . Itt tehát 16 tulajdonságot soroltunk fel, eggyel többet, mint amennyi a rendezett test nevű algebrai struktúrát jellemzi. Ez az egyetlen tulajdonság az, amely a rendezett
testet teljes rendezett testté teszi. A (Q1)-(Q15) és (R1)(R16) tulajdonságrendszerek között azonban nem csak az a különbség, hogy az utóbbi eggyel több tagból áll. A (Q1)-(Q15) tulajdonságrendszer nem jellemzi a racionális számok halmazát: van a racionális számok struktúrájától lényegesen, tehát nem csupán az elemek ”elnevezésében” különböző rendezett test. Ez azt jelenti, hogy a racionális számok halmazát nem lehet úgy felfogni, mint az egyetlen olyan ”dolog”, amit a (Q1)-(Q15) tulajdonságrendszer jellemez. Kicsit fennköltebben ezt úgy is mondhatjuk, hogy a (Q1)-(Q15) tulajdonságrendszer nem tekinthető a racionális számok axiómarendszerének. Ez azt is jelenti, hogy ahhoz, hogy pontosan értsük, hogy egy racionális szám micsoda, ahhoz nem elég a (Q1)-(Q15) tulajdonságrendszert tudni: a racionális számoknak még van valami olyan tulajdonsága, ami kiemeli ezt a rendezett
testet az összes többi közül. Ennek a problémának a részleteibe itt nem kı́vánunk belemenni, csak megjegyezzük, hogy a racionális számok halmazát az tünteti ki az összes többi rendezett test közül, hogy bizonyos értelemben ő a ”legkisebb”: minden rendezett test tartalmaz egy olyan részt, amely, mint rendezett test, azonosnak tekinthető a racionális számok halmazával. Ez másszóval azt jelenti, hogy ha egy olyan struktúrát akarunk, amelyben lehet összeadni, szorozni és nagyság szerint összehasonlı́tani a (Q1)-(Q15) tulajdonságrendszer szabályai szerint, akkor ennek a struktúrának biztosan lesz egy olyan része, ami az általunk ismert racionális számoknak felel meg  s persze, ekkor olyan részei is lesznek, amelyek az egész, illetve természetes számoknak felelnek meg. Tehát ha valaki bármilyen más úton-módon kı́vánja saját maga számára felépı́teni a természetes számok,
az egész számok és a racionális számok halmazát, akkor a legökonomikusabban akkor jár el, ha az általunk vázolt felépı́tést követi: ekkor ugyanis a legkisebb rendezett testhez, a racionális számok testéhez fog eljutni, ami a minimum ahhoz, hogy a (Q1)-(Q15) tulajdonságrendszer teljesüljön. Röviden, a fenti (Q1)-(Q15) tulajdonságrendszer nem határozza meg egyértelműen a racionális számok halmazát. Más a helyzet az (R1)-(R16) tulajdonságrendszerrel, mely a teljes rendezett testeket jellemzi Amint ugyanis a fentiekben rámutattunk, az a meglepő dolog derül ki, hogy bár rendezett testből van sok, amelyek lényegesen különböznek, de teljes rendezett testből már csak     58  A számfogalom  egy van: ez a valós számok halmaza. Az (R1)-(R16) tulajdonságrendszer tehát egyértelműen jellemzi a valós számok halmazát: aki ezt a tulajdonságrendszert ismeri, az mindent tud a valós számokról 
még akkor is, ha ezt esetleg nem is veszi észre. Hiszen az (R1)-(R16) tulajdonságrendszert egyedül a valós számok halmaza elégı́ti ki, tehát a valós számok axiómarendszerének tekinthető. Ezek az axiómák magukban foglalják a ”valós szám” ideális fogalmának összes lehetséges tulajdonságát, s ha a valós számok halmazának gazdagságára gondolunk, tulajdonképpen meglepő, hogy ezt a bonyolult fogalmat 16 egyszerű tulajdonsággal sikerül jellemezni. A korábbiakban már többször felsorolt tulajdonságoknak, mint tudjuk, különböző elnevezései használatosak, melyeket most nem kı́vánunk megismételni. Az újdonság a teljesség. Éppen ennek a teljességi tulajdonságnak vannak olyan további következményei, melyek azt mutatják, hogy érdemes volt a racionális számok halmazát tovább bővı́teni. A következőkben a valós számok halmazának néhány ilyen fontos
tulajdonságát soroljuk fel, általában bizonyı́tások nélkül.  2.11  A valós számok hatványozása  A valós számok hatványozásával kapcsolatban mindenekelőtt jegyezzük meg, hogy az egész kitevőjű hatványozás semmilyen probklémát nem jelent, ugyanúgy, mint a racionális alap esetén, pozitı́v egész kitevő az ismételt szorzást jelenti, mı́g a negatı́v egész kitevő  nullától különböző alap mellett  a megfelelő pozitı́v kitevőjű hatvány reciprokát. Ezekre az esetekre tehát érvényben maradnak a 282 tétel állı́tásai Most foglalkozzunk a valós számok n1 kitevőjű hatványozásával, ahol n pozitı́v egész szám Ha a egy valós szám, n pedig egy pozitı́v egész szám, akkor a b valós számot az a valós szám n-edik gyökének nevezzük, ha fennáll bn = a .  (19) √ Nagy a kı́sértés, hogy ilyenkor a b számot n a módon jelöljük, ám ez több
szempontból teljesen helytelen lenne. A kisebb gond az, hogy egyáltalán nem biztos, hogy létezik ilyen b, ı́gy nem világos, hogy ez a szimbólum egyáltalán jelent-e valamit. A nagyobb baj az, ha több ilyen b van, hiszen akkor nem lehet √ n a ezek közül melyiket jelöli. Könnyen kiderülhet, hogy még az tudni, hogy √ √ n a = n a egyenlőség helyességében sem lehetünk biztosak. Ilyen esetekre már az egész számok halmazában is ismerünk példát, hiszen nyilván 2-nek és −2-nek egyaránt 16 a negyedik hatványa, ı́gy újdonsült terminológiánk szerint 2 is és −2 is a 16-nak negyedik gyöke. Maradjunk annyiban, hogy pillanatnyilag egy a valós szám n-edik gyökét nem jelöljük sehogy se. Inkább azt vizsgáljuk meg, hogy mikor létezik n-edik gyök, és ha létezik, akkor mikor egyértelmű. Erről ad kimerı́tő tájékoztatást a következő fontos tétel. 2.111 Tétel Minden pozitı́v
valós számnak egyértelműen létezik pozitı́v n-edik gyöke, tetszőleges n pozizı́v egész szám esetén.     2.11 A valós számok hatványozása  59  A tétel szerint tehát ha n = 1, 2, .   és a > 0 valós szám, akkor pontosan egy olyan b >√0 valós szám létezik, melyre bn = a teljesül. Nos, ezt a b számot jelöljük b = n a módon. A tételt itt nem bizonyı́tjuk A bizonyı́tás egyébként azon múlik, hogy ha az adott a > 0 szám és n > 0 egész szám esetén A jelöli mindazon valós számok halmazát, melyek negatı́vok, vagy n-edik hatványuk kisebb, mint a, akkor nem nehéz megmutatni, hogy A egy szelet a valós számok halmazában, s a teljesség miatt létezik olyan b valós szám, melyre A =] − ∞, b[ teljesül. Erről a b-ről könnyű bebizonyı́tani, hogy n-edik hatványa nem lehet sem kisebb, sem nagyobb, mint a. Ez a gondolatmenet egyébként tipikus példája annak, hogy
miként lehet a valós számok teljességi tulajdonságát ilyen állı́tások igazolásakor felhasználni. A pozitı́v valós számok n-edik gyökével kapcsolatban hasznosak lesznek a következőkben az alábbi tételben foglalt azonosságok. 2.112 Tétel Legyenek a, b pozitı́v valós számok, m, n pedig pozitı́v egész számok Ekkor fennáll √ √ √ (i) n a · b = n a · n b , ¡ √ ¢m √ (ii) n am = n a . Bizonyı́tás. Az első állı́tás bizonyı́tásához azt kell igazolnunk, hogy az egyenlőség jobb oldalán álló szám n-edik hatványa a·b, hiszen ez a tulajdonság definiálja az n-ik gyököt. Ez viszont világos az √ ¢n ¡ √ ¢n ¡ √ ¢n ¡√ n n n a· b = na · b egyenlőség miatt, ami az (x·y)n = xn ·y n nyilvánvaló azonosság következménye. A második állı́tást az elsőből m szerinti teljes indukcióval kapjuk. Valóban, m = 1 esetén az állı́tás nyilvánvaló.
Tegyük fel, hogy m-re már igazoltuk az állı́tást, ekkor m + 1-re √ √ √ ¡ √ ¢m √ ¡ √ ¢m+1 √ n am+1 = n am · a = n am · n a = n a · n a = n a .  Az eddigiek alapján tehát a pozitı́v valós számok körében a pozitı́v egész kitevőjű gyökvonás korlátlanul és egyértelműen elvégezhető. Ennek felhasználásával értelmezzük pozitı́v valós számok valós kitevőjű hatványozását, mellyel kapcsolatban arra törekszünk, hogy a 2.23, 261 és 282 tételek azonosságai lehetőleg érvényben maradjanak. Először a racionális kitevőjű hatványozást értelmezzük. Legyen tehát a > 0 valós szám, p pedig racionális szám. Ekkor p felı́rható m p= n     60  A számfogalom  alakban, ahol m egész szám, n 6= 0 természetes szám. Legyen ekkor ¡ √ ¢m . ap = n a  (20)  Nyilván igazolnunk kell, hogy ez az értelmezés független attól, hogy a p racionális számot
milyen módon ı́rtuk fel két egész szám hányadosaként. Másszóval, ha k m = , (21) n l ahol m, k egész számok, n, l pedig pozitı́v természetes számok, akkor fenn kell állnia a ¢m ¡√ ¢k ¡√ n a = la , (22) egyenlőségnek. A (21) azt jelenti, hogy m · l = k · n Mivel itt m és k egyszerre pozitı́v, vagy negatı́v, feltehetjük, hogy mindkettő pozitı́v, √ ugyanis a másik esetben hasonló okoskodást alkalmazhatunk. Legyen b = n a, ekkor bn = a, és (22) fennállásához az kell, hogy ¢k ¡√ l bn bm = teljesüljön. A 2112 tétel második állı́tása szerint a jobb oldal √ ¢k √ ¡√ ¢l ¡√ l l l l bn = bn·k = bm·l = bm = bm , s ezzel bebizonyı́tottuk, hogy a (20) definı́ció nem függ attól, hogy a p racionális számot milyen módon ı́rtuk fel két egész szám hányadosaként. Ezek után következzen a pozitı́v valós számok racionális kitevőjű hatványozásával kapcsolatos
alapvető tétel. 2.113 Tétel Bármely a, b pozitı́v valós számok és p, q racionális számok esetén érvényesek a következők: (i) ap+q = ap · aq , ¡ ¢q (ii) ap = ap·q , (iii) (a · b)p = ap · bp . Bizonyı́tás. Az előbbiekben láttuk, hogy az ap hatvány nem függ attól, hogy a p racionális számot milyen módon ı́rtuk fel két egész szám hányadosaként. Ezért feltehetjük, hogy a tételben szereplő p, q racionális számoknak azonos a nevezőjük, azaz m k q= , p= n n ahol k, m egész számok, n pedig pozitı́v egész szám. Az első állı́tás bizonyı́tása: k  m  k+m  ap+q = a n + n = a n =  ¢k+m ¡√ n a =     2.11 A valós számok hatványozása  =  61  ¢k ¡ √ ¢m ¡√ k m n a · n a = a n · a n = ap · aq .  A számı́tás során felhasználtuk, hogy a 2.82 tétel állı́tásai  amint azt fentebb megjegyeztük  valós alap esetén is érvényesek. A második állı́táshoz
azt kell igazolni, hogy mindkét oldalon olyan pozitı́v valós szám áll, amelynek n · n-edik hatványa ak·m , ekkor ugyanis a két szám egyenlő, a gyökvonás egyértelműsége miatt. Az egyszerű részleteket az Olvasóra bı́zzuk. Végül a harmadik állı́tás bizonyı́tása: k  (a · b)p = (a · b) n = =  ¢k ¡ √ √ ¢k ¡√ n n a·b = na· b =  ¢k ¡ √ ¢k ¡√ k k n n a · b = a n · b n = ap · bp .  Itt ismét felhasználtuk azt, hogy a 2.82 tétel állı́tásai valós alap esetén is érvényesek, valamint a 2112 tétel első állı́tását A racionális kitevőjű hatványozást tehát pozitı́v valós alap esetén sikerült úgy értelmezni, hogy a hatványozásnak a hétköznapi gyakorlatból megismert tulajdonságai, az alapvető számolási szabályok érvényben maradjanak. Mivel a gyökvonás ezáltal a hatványozás speciális esete, ı́gy a gyökös kifejezésekkel való
számolás egyszerű szabályai is levezethetők az előző tételben szereplő tulajdonságokból. Javasoljuk az Olvasónak, hogy gyakorlásképpen gyűjtsön össze minél több ilyen szabályt, s próbálja meg őket önállóan bebizonyı́tani, a fentiek mintájára. Alapelvként azonban mégegyszer leszögezhetjük, hogy pozitı́v valós számok racionális kitevőjű hatványozásakor a következőket kell észben tartanunk: pozitı́v egész kitevőjű hatvány ismételt szorzást jelent, negatı́v egész kitevőjű hatvány a megfelelő pozitı́v egész kitevőjű hatvány reciprokát jelenti, a 0 kitevőjű hatvány értéke mindig 1, az n1 kitevőjű hatvány pozitı́v egész n esetén n-edik gyökvonást jelent, végül az m n kitevőjű hatványozás tetszőleges m és pozitı́v n egész számok esetén az n-edik gyökvonásnak és az m-edik hatványra emelésnek az egymás utáni
elvégzését jelenti, tetszőleges sorrend1 ben. Tehát például az a > 0 valós szám és az n pozitı́v egész szám esetén a− n jelentése − n1 = −1 n miatt: az a pozitı́v valós szám reciprokának n-edik gyöke. A fenti azonosságok miatt ez ugyanaz, mint az a pozitı́v valós szám n-edik gyökének reciproka. Megjegyezzük, hogy miután a gyökvonást csak pozitı́v egész gyökkitevő ezért nem használunk ilyen jelöléseket, √ esetén értelmeztük, √ √ 1 a ı́rásmódot sem használjuk; helyette hogy −2 a, −3 a, stb. Valójában az √ √ 2 egyszerűen a-t ı́runk, s a a jelölés sem használatos: ezt a megszokott a pótolja. Végső lépésként ki kellene terjesztenünk a hatványozást pozitı́v valós alap esetén tetszőleges valós kitevőre. Ez a következő módon lehetséges Legyen a pozitı́v, b tetszőleges valós szám. Értelmezni kı́vánjuk az ab
hatványkifejezést, de úgy, hogy amennyiben b racionális szám, akkor jelentése megegyezzen az     62  A számfogalom  eddigiekkel. Tegyük fel először, hogy a > 1 Jelöljük ekkor A-val azt a halmazt, melynek elemei az összes negatı́v valós számok, a 0, valamint azok a pozitı́v valós x számok, melyekre x < ap teljesül valamely p < b racionális szám esetén. Nem nehéz igazolni, hogy A szelet a valós számok halmazában. A valós számok teljessége miatt tehát van olyan h valós szám, melyre A =] − ∞, h[ . Ekkor legyen ab = h. Tehát az a > 1 valós szám b-edik hatványa az az egyértelműen meghatározott ab valós szám, mely a következő valós számokból álló szeletet határozza meg: az összes nem pozitı́v valós számok, valamint azok a pozitı́v valós számok, melyeknél van az a-nak olyan nagyobb hatványa, melynek kitevője b-nél kisebb racionális szám. Az a = 1 esetben
természetesen definı́ciónk a következő: tetszőleges valós b mellett 1b = 1, végül a 0 < a < 1 esetben ¡ ¢−b . Kissé hosszadalmasan, de meg lehet megmutatni, hogy ha b legyen ab = a1 racionális szám, akkor ab ugyanazt jelenti, mint eddig. Ugyancsak bebizonyı́tható a következő tétel 2.114 Tétel Bármely a, b > 0 és c, d tetszőleges valós számok esetén érvényesek a következők: (i) ac+d = ac · ad , ¡ ¢d (ii) ac = ac·d , (iii) (a · b)c = ac · bc . A tétel szerint tehát programunk megvalósult: a pozitı́v valós számok körében a hatványozás korlátlanul elvégezhető, másszóval, bármely a > 0 és b valós számok esetén az ab = x egyenletnek egyértelműen létezik x > 0 megoldása. Sőt, a hatványozás tulajdonságaiból az is látható, hogy bármely a > 0 és b valós számok esetén az xb = a 1  egyenletnek is egyértelműen létezik x > 0 megoldása:
x = a b . Ha tehát egy hatványkifejezésben ismerjük a pozitı́v alapot és a tetszőleges kitevőt, akkor egyértelműen meg van határozva a hatvány pozitı́v értéke. Hasonlóan, ha ismerjük a hatvány pozitı́v értékét és a kitevőt, akkor egyértelműen meg van határozva az alap pozitı́v értéke. A harmadik lehetőség az volna, hogy az adott alapból és a hatvány értékéből határozzuk meg a kitevőt, ám ezzel a problémával majd a későbbiekben fogunk foglalkozni. Megjegyezzük, hogy a fenti második 1 egyenlet x megoldását, tehát az x = a b pozitı́v valós számot a fenti analógiák alapján lehetne az a szám ”b-edik gyökének” nevezni, ám ez a gyakorlatban nem szokás, kivéve, persze, ha b valamely 1-nél nagyobb egész szám.     A valós számok további tulajdonságai  63  Mindeddig csak pozitı́v valós számok hatványozásáról beszéltünk, s azt is
láttuk, hogy a hatványozás megszokott szabályainak érvényben maradása mellett lehetetlen a hatványozást tetszőleges valós alap mellett tetszőleges valós kitevőre kiterjeszteni. Mégis vannak olyan esetek, amikor van értelme negatı́v alap esetén is bizonyos kitevőjű hatványokról beszélni, s ezek többé-kevésbé beilleszthetők a megszokott keretek közé. Ilyen esetekre találunk példát a gyökvonásnál: könnyű látni, hogy ha a negatı́v valós szám, akkor bármely n páratlan egész szám esetén egyértelműen létezik olyan b negatı́v valós szám, hogy bn = a, másszóval, minden negatı́v valós számnak egyértelműen létezik páratlan egész kitevőjű gyöke. Ha tehát n = 2k + 1,√ahol k természetes szám, akkor bármely a valós szám esetén van értelme az n a gyökkifejezésnek, mely a √= 0 esetén 0, a > 0 esetén pozitı́v, a < 0 esetén pedig
negatı́v. Így például 3 −8 = −2, √ 7 −128 = −2, stb. Ezekre az esetekre érvényes az √ √ n −a = − n a azonosság. Itt tehát n páratlan természetes szám, a pedig tetszőleges valós szám Ennek alapján a negatı́v valós számok olyan racionális p kitevőjű hatványai is értelmet nyernek, melyeknél a p felı́rható p=  k n  alakban, ahol k egész szám, n pedig páratlan természetes szám.  2.12  A valós számok további tulajdonságai  A pozitı́v racionális számok korlátlan racionális kitevőjű hatványozásához tehát új számokat kellett ”kitalálni”, melyeket a racionális számok bizonyos szeletei testesı́tenek meg. Azokat a valós számokat, amelyek √ nem racionálisak, irracionális számoknak nevezzük. A 281 tétel szerint a 2 például irracionális szám. A prı́mtényezős felbontásról szóló 271 tétel alapján nem nehéz bebizonyı́tani, hogy egy
pozitı́v természetes szám 1-nél nagyobb kitevőjű gyöke mindig vagy egész szám, vagy irracionális. Így például, ha egy pozitı́v egész szám nem négyzetszám, azaz, nem négyzete egy természetes számnak, akkor négyzetgyöke mindig irracionális. Ezek szerint elég sok irracionális szám van, valójában sokkal több, mint racionális szám, de ennek a kijelentésnek a pontos értelmét jelenleg nem tudjuk tisztázni. Mindenesetre racionális számból is van éppen elég, amint az a következő tételből kiderül. 2.121 Tétel Bármely két valós szám között van racionális szám Ha tehát a < b valós számok, akkor van olyan p racionális szám, hogy a < p < b. Másszóval, a valós számok halmazában minden nyı́lt intervallum tartalmaz racionális számot. Ez a valós számok halmazának a következő, úgynevezett archimédeszi-tulajdonságából következik     64  A
számfogalom  2.122 Tétel Ha x, y valós számok és x > 0, akkor van olyan n természetes szám, hogy n · x > y. Bizonyı́tás. Az állı́tás nyilván igaz, ha y ≤ 0, hiszen ekkor vehetjük az n = 1 természetes számot. Feltesszük, hogy y > 0 Ekkor az állı́tás nyilván ekvivalens azzal, hogy nincs olyan valós szám, amely minden természetes számnál nagyobb. Valóban, tegyük fel először, hogy a tétel állı́tása igaz, és mégis van egy olyan K valós szám, mely minden természetes számnál nagyobb: n ≤ K teljesül minden n természetes szám esetén. A K nyilván nem lehet természetes szám, hiszen ekkor K + 1 is az lenne, ami nagyobb K-nál. Így valójában n < K teljesül minden n természetes számra. Ha tehát y = K és x = 1, akkor nincs olyan n természetes szám, amelyre n · x = n > K teljesülne, s ez ellentmond tételünk állı́tásának. Megfordı́tva, tegyük fel,
hogy hogy nincs olyan valós szám, amely minden természetes számnál nagyobb, s legyenek x, y > 0 valós számok. A feltétel szerint van olyan n természetes szám, melyre n > xy teljesül, amiből n · x > y adódik, s ezzel bebizonyı́tottuk, hogy tételünk állı́tása ekvivalens azzal, hogy nincs olyan valós szám, amely minden természetes számnál nagyobb. Ezek után elegendő ez utóbbi állı́tást igazolni. Tegyük fel tehát, hogy valamely K valós szám esetén n ≤ K teljesül minden n természetes számra. A fenti érvelés alapján K nem lehet természetes szám, ı́gy n < K teljesül minden n természetes számra. Ha A jelöli mindazon x valós számok halmazát, melyekre x < −n teljesül minden n természetes szám esetén, akkor A egy szelet a valós számok halmazában. Valóban, A nem üres, hiszen −K az A-hoz tartozik. Továbbá A valódi részhalmaza R-nek, hiszen például
0 nem tartozik A-hoz. Az nyilvánvaló, hogy ha x az A-hoz tartozik és y < x, akkor y is A-hoz tartozik, és az is, hogy A-nak nincs legnagyobb eleme. Így a valós számok teljessége miatt van olyan a valós szám, hogy A =] − ∞, a[ . Mivel a nem tartozik A-hoz, ı́gy van olyan n0 természetes szám, hogy −n0 ≤ a, s ezért −(n0 + 1) = −n0 − 1 ≤ a − 1 < a , ami lehetetlen, hiszen a − 1 az A-hoz tartozik, ı́gy a − 1 < −(n0 + 1) kellene, hogy teljesüljön. Ezzel a tételt bebizonyı́tottuk Javasoljuk, hogy az Olvasó ennek a tételnek a segı́tségével kı́sérelje meg bebizonyı́tani a 2.121 tételt A 2.121 tétel alapján könnyű igazolni, hogy az irracionális számok is rendelkeznek a megfelelő tulajdonsággal: bármely két valós szám között van irracionális szám Az Olvasó számára nem fog nehézséget okozni ennek az állı́tásnak az igazolása. A valós számok archimédeszi
tulajdonsága könnyen szemléltethető geometriailag a korábban már emlı́tett számegyenesen: ez a tulajdonság azt jelenti,     2.12 A valós számok további tulajdonságai  65  hogy az egységszakaszt egymás után elég sokszor felmérve bármely szakasznál hosszabb szakaszt kaphatunk. Bár a valós számok archimédeszi tulajdonságát a teljesség felhasználásával bizonyı́tottuk be, nem nehéz megmutatni, hogy a racionális számok halmaza is archimédeszi tulajdonságú. Ugyanakkor vannak a teljességnek olyan következményei is, amelyekkel a racionális számok halmaza nem rendelkezik Egy ilyen tulajdonság megfogalmazásához szükségünk van a következő fogalomra. Legyen minden n természetes szám esetén adott az [an , bn ] zárt intervallum. Akkor mondjuk, hogy ezek az intervallumok intervallum-skatulyázást alkotnak, ha [an+1 , bn+1 ] ⊆ [an , bn ] teljesül minden n természetes szám esetén.
Másszóval, minden intervallum tartalmazza a következőt. Ez nyilván azt jelenti, hogy minden n természetes szám esetén fennáll az an ≤ an+1 ≤ bn+1 ≤ bn egyenlőtlenségsorozat Az ilyen intervallum-skatulyázásokkkal kapcsolatos a valós számok halmazának a következő tételben kifejezett tulajdonsága 2.123 Tétel A valós számok halmazában bármely [an , bn ] intervallum-skatulyázás esetén ezeknek az intervallumoknak van közös pontja: ∞   [an , bn ] 6= ∅ .  n=0  Bizonyı́tás. Azt kell tehát bebizonyı́tanunk, hogy létezik olyan c valós szám, hogy an ≤ c ≤ bn teljesül minden n természetes szám esetén. Jelölje A mindazon x valós számok halmazát, melyekre x < an teljesül valamely n természetes szám esetén. Másszóval, A azokat a valós számokat tartalmazza, melyeknél van az adott intervallum-skatulyázáshoz tartozó intervallumok baloldali végpontjai között olyan, ami
ennél a számnál nagyobb. Világos, hogy A egy szelet a valós számok halmazában. Valóban, bármely a0 -nál kisebb valós szám rendelkezik a megadott tulajdonsággal, ı́gy az A nem üres. Másrészt, a b0 biztosan nem tartozik A-hoz, ı́gy A az R-nek valódi részhalmaza. Végül az, hogy ha x az A-hoz tartozik és y < x, akkor y is A-hoz tartozik, az A definı́ciója folytán teljesen nyilvánvaló, csakúgy, mint az, hogy A-nak nincs legnagyobb eleme. A valós számok teljessége alapján van olyan c valós szám, hogy A =] − ∞, c[ . Ekkor nyilván an ≤ c teljesül minden n természetes szám esetén, hiszen ha n szám is A-ba tartozna, valamely n-re c < an állna fenn, akkor például a c+a 2 ami lehetetlen, hiszen ez a szám c-nél nagyobb. Másrészt, ha valamely n-re bn < c teljesülne, akkor viszont például a bn2+c szám sem tartozna A-hoz, de ez ugyancsak lehetetlen, hiszen ez a szám c-nél kisebb.
Ezért azt kaptuk, hogy minden n természetes szám esetén fennáll an ≤ c ≤ bn , tehát c az összes [an , bn ] intervallumok közös pontja.     66  A számfogalom  Ne gondoljuk, hogy a valós számok halmazának ez a tulajdonsága a racionális számok halmazában is teljesül: valójában meg lehet mutatni, hogy ez a tulajdonság a teljességgel ekvivalens, akár azt helyettesı́thetné is a valós számok axiómarendszerében. Ez a képessége tehát a racionális számok halmazának biztosan nincs meg, a rendezett testek közül lényegében kizárólag a valós számokra jellemző. Megjegyezzük, hogy a tételben lényeges, hogy zárt intervallumokról legyen 1 [ nyı́lt intervallumokból álló, ugyancsak egyszó. Ugyanis, ha például a ]0, n+1 másba skatulyázott intervallumokat tekintjük minden n természetes szám esetén, akkor nyilván nincs olyan valós szám, amely ezek mindegyikéhez hozzá
tartozna. Ez ugyanis olyan pozitı́v valós szám lenne, mely minden pozitı́v természetes szám reciprokánál kisebb lenne, ami lehetetlen, hiszen ekkor az ő reciproka minden természetes számnál nagyobb lenne, s ez az archimédeszi tulajdonság miatt lehetetlen, amint azt a 2.122 tételben láttuk A valós számok halmazának a következő, alapvetően fontos tulajdonsága megfogalmazásához néhány egyszerű fogalomra van szükségünk. Legyen H a valós számok halmazának egy részhalmaza. Akkor mondjuk, hogy a H halmaz alulról korlátos, ha van olyan k valós szám, melyre k ≤ h teljesül a H halmaz minden h eleme esetén. Minden ilyen k számot a H halmaz egy alsó korlátjának nevezzük. Analóg módon, akkor mondjuk, hogy a H halmaz felülröl korlátos, ha van olyan K valós szám, melyre h ≤ K teljesül a H halmaz minden h eleme esetén, s minden ilyen tulajdonságú K számot a H halmaz egy felső
korlátjának nevezzük. Tehát egy alulról, illetve felülről korlátos halmaznak végtelen sok alsó, illetve felső korlátja létezik, hiszen minden alsó korlátnál kisebb szám ugyancsak alsó korlát, s minden felső korlátnál nagyobb szám ismét felső korlát. Különösen érdekes az a kérdés, hogy vajon egy alulról korlátos halmaznak van-e ”optimális” alsó korlátja, tehát olyan alsó korlátja, amely ”alulról” a ”lehető legközelebb van” a halmazhoz: nála nagyobb alsó korlátja már nincs a halmaznak. Világos, hogy ha például egy halmaznak van legkisebb eleme, akkor az egyben legnagyobb alsó korlát is, de mi van azokkal a halmazokkal, amelyeknek nincs kegkisebb eleme, de mégis alulról korlátosak? Van ezeknek ilyen ”optimális”, tehát legnagyobb alsó korlátjuk? Például, az összes pozitı́v valós számok halmaza nyilván alulról korlátos, hiszen bármelyik
negatı́v szám e halmaznak alsó korlátja, de nincs legkisebb pozitı́v szám, ı́gy első pillantásra nem világos, hogy van-e a pozitı́v valós számok halmazának legnagyobb alsó korlátja? Persze, rövid gondolkodás után rájöhetünk, hogy van: a 0 ilyen legnagyobb alsó korlát, hiszen egyrészt alsó korlát, mert minden pozitı́v valós számnál kisebb, másrészt, bármely 0-nál nagyobb, tehát pozitı́v valós szám már nem alsó korlát, mert annál viszont van kisebb pozitı́v szám. Ezzel egyben jellemztük is azt a fogalmat, amelyet egy halmaz pontos alsó korlátjának, vagy legnagyobb alsó korlátjának nevezünk: a H halmaz pontos alsó korlátja, másszóval infimuma a k valós szám akkor, ha k a H-nak alsó korlátja, és bármely k-nál nagyobb valós szám a H-nak nem alsó korlátja. Ennek jele: inf H Teljesen hasonlóan jutunk el a pontos felső korlát, vagy legkisebb felső
korlát fogalmához, melyet     2.12 A valós számok további tulajdonságai  67  szupremumnak is szokás nevezni: a H halmaz pontos felső korlátja a K szám, ha K a H halmaznak felső korlátja, és egyetlen K-nál kisebb szám sem felső korlátja a H halmaznak. Ennek jele: sup H Megjegyezzük, hogy a pontos alsó, illetve pontos felső korlátot szokás alsó határnak, illetve felső határnak is nevezni. Ezekkel a jelölésekkel kapcsolatban még egy konvenció használatos: ha a H halmaz nem korlátos alulról, illetve felülről, akkor ezt szimbolikusan az inf H = −∞, illetve sup H = +∞ módon szoktuk jelölni. Megjegyezzük, hogy az üres halmaz nyilván alulról is és felülről is korlátos, de nyilván nem létezik sem pontos alsó, sem pontos felső korlátja. Ha egy halmaz alulról is és felülről is korlátos, akkor röviden azt mondjuk, hogy korlátos. Világos, hogy ezek a fogalmak tetszőleges
rendezett halmazban értelmes jelentéssel bı́rnak. Kiderül, hogy a ”pontos korlát” létezése a valós számok halmazának ugyanolyan karakterisztikus tulajdonsága, mint a teljesség, vagy az intervallumskatulyázásokkal kapcsolatos sajátosság. Amit elvárhatunk  például alulról korlátos halmazokkal kapcsolatban  az annyi, hogy ha egy alulról korlátos halmaz nem üres, akkor legyen pontos alsó korlátja. Ez a tulajdonság könnyen látható módon nem teljesül a racionális számok halmazában, ugyanis nem nehéz megmutatni, hogy a pozitı́v racionális számok halmazának az a részhalmaza, melyhez tartozó elemek négyzetei nagyobbak, mint 2, alulról korlátos, természetesen nem üres, és mégsincs pontos alsó korlátja, mert ha lenne, annak négyzete szükségképpen 2 kellene, hogy legyen, ám ilyen racionális szám nincs. Tehát a racionális számok halmazában a fentebb emlı́tett elvárás
nem teljesül: ebben a halmazban vannak olyan nem üres, alulról korlátos részhalmazok, melyeknek nincs pontos alsó korlátjuk, mert minden alsó korlátjuknál van nagyobb alsó korlátjuk. A valós számok halmazában viszont ez nem fordulhat elő, amint azt a következő tétel mutatja. 2.124 Tétel A valós számok halmazában minden nem üres, alulról korlátos halmaznak van pontos alsó korlátja. Bizonyı́tás. Legyen H a valós számok halmazának egy nem üres, alulról korlátos részhalmaza. Jelölje A mindazon valós számok halmazát, melyek a H valamely alsó korlátjánál kisebbek. Mivel H alulról korlátos, ı́gy A nem üres, s mivel H-nak van eleme, ı́gy A nem az egész R. Tehát A valódi részhalmaza R-nek Másrészt, ha x az A halmazhoz tartozik, akkor nyilvánvaló, hogy bármely x-nél kisebb y is az A-hoz tartozik. Most két esetet különböztetünk meg: ha A-nak nincs legnagyobb eleme,
akkor A szelet, s a valós számok halmazának teljessége miatt van olyan a valós szám, hogy A =] − ∞, a[ teljesül. Ekkor a nyilván pontos alsó korlátja H-nak Valóban, ha h a H tetszőleges eleme, akkor h < a lehetetlen, hiszen ekkor bármely h és a közötti valós szám A-hoz tartozna, s ı́gy lenne h-nál nagyobb alsó korlátja H-nak, ami ellentmondás. Másrészt, ha a-nál lenne nagyobb alsó korlátja H-nak, akkor a is A-hoz tartozna, ami ugyancsak lehetetlen. Ebben az esetben tehát a tétel állı́tását bebizonyı́tottuk: van a H-nak pontos alsó korlátja.     68  A számfogalom  A másik eset az, hogy A nem szelet, tehát van legnagyobb eleme, melyet most is jelöljön a. Világos, hogy a a H egy alsó korlátja Másrészt, ha lenne Hnak a-nál nagyobb alsó korlátja, mondjuk b, akkor a nem lehetne az A halmaz legnagyobb eleme, hiszen nála nagyobb számokra, az a és b közötti összes valós
számra teljesülne az, ami az A halmaz elemeit definiálja. Ezek szerint ebben az esetben is azt kapjuk, hogy H-nak van pontos alsó korlátja, s ezzel a tételt bebizonyı́tottuk. A felülről korlátos, nem üres halmazokra nyilván egy hasonló tétel fogalmazható meg és bizonyı́tható be; ezt az Olvasóra bı́zzuk. Megjegyezzük, hogy a pontos korlát létezésével kapcsolatos fenti tulajdonság ugyancsak ekvivalens a valós számok halmazának teljességével.  2.13  A logaritmus és tulajdonságai  A 2.11 szakaszban emlı́tettük, hogy az ab = c egyenlőség a valós számok halmazában rendelkezik a következő tulajdonsággal: ha c-t tekintjük ismeretlennek, tehát az ab = x egyenlettel foglalkozunk, akkor ez bármely a pozitı́v valós szám és b valós szám esetén egyértelműen megoldható a pozitı́v valós számok halmazában. Például, ha azt kérdezzük, hogy mennyi a = 12-nek a b = −2-dik
hatványa, akkor a 1 . Ha a-t tekintjük ismeretlennek, választ hatványozással kapjuk: x = 12−2 = 144 tehát az xb = c egyenletet akarjuk megoldani, akkor ez ugyancsak bármely c pozitı́v valós szám és b valós szám esetén egyértelműen megtehető a pozitı́v valós számok halmazában. Például: melyik számnak a b = −3-dik hatványa c = 8? A megoldást ilyenkor ugyancsak hatványozással kapjuk, ami a jelen esetben gyökvonás: 1 x = 8− 3 = 21 . Most a harmadik lehetőséggel fogunk foglalkozni, tehát legyenek a, c adott pozitı́v valós számok, és keressünk olyan x valós számot, melyre ax = c  (23)  teljesül. Valójában tehát az adott pozitı́v alaphoz és a hatvány adott pozitı́v értékéhez keressük a kitevőt. Ilyen tı́pusú kérdésekre várunk tehát választ: 1 ? Itt a hatványozás csak közvetve segı́t, hányadik hatványa a = 3-nak a c = 27 hiszen az előbbi két esetben
mindig ismertük a kitevőt, ám most éppen az az ismeretlen. Bár az előbbi számpélda egyetlen megoldását rövid gondolkodás után x = −3 alakban kitalálhatjuk, de világos, hogy az ilyen feladatok megoldásához valamilyen általános módszerre van szükség.     2.13 A logaritmus és tulajdonságai  69  Gondoljuk el, hogy a következő feladatot akarjuk megoldani: hányadik hatványa 2-nek 512? Tehát adott az alap és a hatvány értéke, s ezekhez keressük a megfelelő kitevőt. Nyilvánvaló, hogy jelenlegi ismereteink alapján ezt a feladatot csak próbálkozással tudjuk megoldani. Ha további ilyen feladatok megoldására kell felkészülnünk, amikor az alap mindig 2, akkor célszerű megjegyeznünk a 2 pozitı́v egész kitevőjű hatványai közül minél többet: 21 = 2, 22 = 4, 23 = 8, 24 = 16, .   , 28 = 256, 29 = 512, s ezzel feladatunkat megoldottuk Látható, hogy ez ı́gy még mindig nagyon
esetleges, a bemutatott példa túlságosan speciális. Mi van akkor, ha a feladat a következő: hányadik hatványa 2-nek 384? A 2 hatványainak előbbi felsorolásából sejthetjük, hogy a 2-nek nincs olyan pozitı́v egész kitevőjű hatványa, ami 384-el egyenlő: mivel 28 = 256 és 29 = 512, továbbá 384 éppen e két szám között ”félúton” van, esetleg arra gondolhatunk, hogy a keresett kitevő is a 8 és 9 között van ”félúton”, azaz 8 és fél, 17 2 értékét! A definı́ciók másszóval, racionális alakban 17 2 . Számı́tsuk tehát ki 2 alapján kalkulátorral közelı́tőleg számolva ¢ ¡√ 17 2 217 ≈ 362 , 22 = ami távolról sem 384, bár értéke valóban 256 és 512 között van. A 17 2 számmal kapcsolatos spekuláció tehát nem vezet eredményre, ez a szám a probléma megoldásának meglehetősen rossz közelı́tése. Hogyan tehetnénk ezt a közelı́tést 17
pontosabbá? Mivel 2 2 túl kicsinek bizonyult, valószı́nűleg a 17 2 is túl kicsi. Ha úgy gondoljuk, hogy nagyobb kitevőhöz nagyobb hatványérték tartozik, akkor próbáljuk meg a 17 2 -et növelni. A számlálót eggyel növelve már 9-et kapunk, ami túl nagy, a nevezőt eggyel csökkentve pedig még nagyobb számot, 17-et. 35 34 4 kiszámı́tásával. Ismét Vegyük figyelembe, hogy 17 2 = 4 , ı́gy próbálkozzunk 2 kalkulátorral számolva a következő közelı́tést kapjuk: ¢ ¡√ 35 4 235 ≈ 430 , 24 = ami viszont már túl nagy. Ha ugyanezen módszer alapján tovább próbálkozunk, akkor a ¢ ¡√ 69 8 269 ≈ 394 , 28 = és  137  2 16 =  √ ¢ ¡ 16 2137 ≈ 378  értékeket kapjuk, amelyek közelednek ugyan a kı́vánt 384-hez, de eljárásunk semmiképpen nem nevezhető egzakt matematikai módszernek, ráadásul a kapott értékek csak közelı́tőek. Tulajdonképpen még abban sem lehetünk
biztosak, hogy van olyan racionális kitevő, melyre a 2-t hatványozva 384-et kapunk eredményül. Márpedig, ha a feladat megoldása egy irracionális szám volna, akkor vajmi kevés reményünk van annak valamilyen értelemben ”pontos” meghatározására. Egyáltalán van olyan valós x szám, hogy 2x = 384? Biztosı́tja valami axióma, tétel, tulajdonság ilyen valós szám létezését? Hiszen láttuk, hogy olyan racionális szám nincs, amelynek a négyzete 2, miért ne lehetne, hogy itt hasonló problémával állunk szemben, amelyet csak a számfogalom további bővı́tésével oldhatunk meg?     70  A számfogalom  A helyzet tisztázása érdekében meg kell vizsgálnunk a hatványozásnak néhány olyan további tulajdonságát, amelyek az egyenlőtlenségekkel vannak kapcsolatban. Korábban azt olvashattuk: ”Ha úgy gondoljuk, hogy nagyobb kitevőhöz nagyobb hatványérték tartozik,” Vajon ez mindig
ı́gy van? Hamar rájöhetünk, hogy nem: az 1-nél kisebb pozitı́v számok egyre nagyobb pozitı́v egész kitevőjű hatványai nyilván egyre kisebbek. A következő tételben összefoglaljuk a hatványozás és az egyenlőtlenségek kapcsolatáról szóló legfontosabb tudnivalókat. 2.131 Tétel Legyenek a, b, c, d tetszőleges valós számok Ekkor fennállnak a következők: (i) ha 1 < a és c < d, akkor ac < ad , (ii) ha 0 < a < 1 és c < d, akkor ac > ad , (iii) ha 0 < a < b és c > 0, akkor ac < bc , (iv) ha 0 < a < b és c < 0, akkor ac > bc . A tétel bizonyı́tása során számos technikai problémát kell leküzdeni, ı́gy a bizonyı́tás hosszadalmas. Javasoljuk az Olvasónak, hogy legalább abban az esetben kı́sérelje meg önállóan bebizonyı́tani a tétel állı́tásait, amikor a kitevők racionális számok. Ehhez célszerűen először a pozitı́v
egész, majd a tetszőleges egész kitevőkkel kell foglalkozni, s legvégül a gyökvonásra vonatkozó megfelelő állı́tásokkal. A fenti tétel első két állı́tása azt fejezi ki, hogy 1-nél nagyobb alap esetén a hatványkitevő növelésével egyre nagyobb számokat kapunk, mı́g 0 és 1 közötti alap esetén éppen fordı́tva: nagyobb kitevőhöz kisebb hatványérték tartozik. Mivel 1-nek minden hatványa 1, ezért az a = 1 esettel nyilván nem kell foglalkozni. A két utolsó állı́tásban viszont arról van szó, hogy nagyobb számnak ugyanazon pozitı́v kitevőjű hatványa nagyobb, mı́g negatı́v kitevőre ez pont fordı́tva érvényes. A 0 kitevő esete ismét nem érdemel külön figyelmet, hiszen minden pozitı́v szám 0-dik hatványa 1. Visszatérve eredeti problémánkra, tehát arra a kérdésre, hogy vajon adott pozitı́v a, c valós számok esetén van-e olyan x valós szám,
hogy a (23) egyenlet fennálljon, legalábbis azt tudjuk válaszolni, hogy ha a = 1 és b 6= 1, akkor nincs ilyen x, ha pedig a = 1 és b = 1, akkor minden valós x ilyen. Ezek szerint a (23) egyenlettel kapcsolatban célszerű feltételezni, hogy a 6= 1. Ilyenkor viszont az egyenletnek legfeljebb egy valós x megoldása lehet, hiszen az előző tétel szerint az 1-től különböző pozitı́v valós számok különböző hatványai különbözők. A megoldás létezésének problémáját a következő tétel oldja meg. 2.132 Tétel Legyenek a, c pozitı́v valós számok, és a 6= 1 Ekkor egyértelműen létezik olyan x valós szám, melyre fennáll (23).     2.13 A logaritmus és tulajdonságai  71  A tétel bizonyı́tása nem könnyű, döntő mértékben a valós számok teljességi tulajdonságán múlik. A gondolatmenetről röviden csak annyit jegyzünk meg, hogy elegendő az a > 1 esettel foglalkozni,
mert a hatványozás tulajdonságai alapján a 0 < a < 1 eset erre visszavezethető. Az a > 1 esetben egy A szeletet definiálunk a valós számok halmazában a következő módon: tartozzanak az A-hoz mindazon y valós számok, melyekre ay < c teljesül. Nem túlságosan nyilvánvaló, de meg lehet mutatni, hogy A egy szelet, s ekkor a teljesség miatt A =]−∞, x[ teljesül valamely x valós számra. Nos, erről az x-ről lehet kimutatni, hogy megoldása a (23) egyenletnek. Ezt az egyértelműen meghatározott x valós számot a c valós szám a alapú logaritmusának nevezzük. Jele: x = loga c Az a számot a logaritmus alapszámának, vagy alapjának nevezzük. Az loga c számot tehát az a tulajdonsága definiálja egyértelműen, hogy aloga c = c . Másszóval, loga c az a valós szám, amelyre az a számot hatványozni kell ahhoz, hogy eredményül c-t kapjunk. Így tehát a b = loga c valamint az ab = c
egyenlőségek ekvivalensek, bármelyikből következik a másik. Ha tehát azt mondom, hogy ”2-nek a 9-edik hatványa 512”, akkor ez ugyanaz, mint ha azt mondanám, hogy ”512-nek a 2-es alapú logaritmusa 9” Mellesleg ez még azt is jelenti, hogy ”512-nek a 9-edik gyöke 2”. Ugyanazt a tényt tehát három egyenértékű módon fejezhetjük ki, attól függően, hogy az ab = c egyenlőségben melyik betű által megtestesı́tett változó szerepét akarjuk kihangsúlyozni. A logaritmus tulajdonságai a hatványozás tulajdonságainak egyenes következményei, s az alábbi tételben foglaljuk össze őket. 2.133 Tétel Bármely a, b 6= 1 valós számok, x, y pozitı́v valós számok és z tetszőleges valós szám esetén fennállnak a következők: (i) loga (x · y) = loga x + loga y , (ii) loga (xz ) = z · loga x , (iii) loga 1 = 0 , (iv) loga b · logb a = 1 , (v) log a1 x = − loga x , (vi) logb x = loga x ·
logb a . Bizonyı́tás. Az első állı́tás bizonyı́tásához legyen b = loga (x · y), ekkor ab = x · y Másrészt, ha c = loga x + loga y, akkor ac = aloga x · aloga y = x · y, s ı́gy b = c következik, amivel az állı́tást igazoltuk. A második állı́tás igazolásához legyen b = loga (xz ), ekkor ab = xz . Ugyanakc kor, ha c = z · loga x, akkor zc = loga x, s ı́gy a z = x, amiből ac = xz következik, ebből pedig az állı́tás.     72  A számfogalom  A harmadik állı́tás nyilvánvaló, hiszen a0 = 1. A negyedik állı́tásban legyen loga b = u és logb a = v. Ez azt jelenti, hogy au = b és bv = a Ezért teljesül au = (bv )u = bu·v , ami azt jelenti, hogy bu·v = b, tehát u · v = 1, amit igazolni kellett. A következő állı́tás bizonyı́tásához legyen b = log a1 x, ekkor ( a1 )b = x, vagyis 1 = x, s ebből a−b = x, majd loga x = −b következik, s ezzel az állı́tást ab igazoltuk. Végül az
utolsó állı́tás bizonyı́tásához legyen loga x = u, logb x = v, ami azt jelenti, hogy au = bv , tudniillik mindkét kifejezés x-szel egyenlő. Mindkét oldal b alapú logaritmusát véve u · logb a = v, azaz az állı́tás adódik. Ezzel a tétel bizonyı́tását befejeztük. A tételben szereplő első és második állı́tás a logaritmus legfontosabb tulajdonságait fejezi ki, melyeket úgy szokás fogalmazni, hogy a logaritmus szorzatot összegbe, hatványozást pedig szorzásba ”visz át”. Természetesen ezek következményeként azonnal kapjuk a loga  x = loga x − loga y , y  (24)  és  √ 1 (25) loga n x = loga x n összefüggéseket, melyek minden a 6= 1 pozitı́v szám, n ≥ 2 pozitı́v egész szám és x, y pozitı́v számok mellett érvényesek. A tétel utolsó állı́tása a különböző alapú logaritmusok közötti átszámı́tás szabályát ı́rja le. Megjegyezzük, hogy a =
10 esetén log10 helyett lg-t ı́runk, tehát lg b = log10 b .  2.14  A komplex számok  A számfogalom felépı́tése során azt láthattuk, hogy a természetes számokból kiindulva az egymást követő újabb és újabb bővı́tésekre, újabb és újabb számok bevezetésére tulajdonképpen azért volt szükség, mert az éppen adott számkörben bizonyos természetesnek látszó aritmetikai feladatokat nem lehetett megoldani. A kezdet kezdetén az egész számok bevezetését az tette szükségessé, hogy a természetes számok halmazában a kivonást csak bizonyos esetekben lehet elvégezni, mı́g a racionális számokra azért volt szükség, mert az egész számok körében az osztás csak korlátozottan végezhető el. Végül, a valós számokra azért volt szükség, hogy a hatványozás elvégezhetőségének a racionális számok körében meglévő korlátait kitágı́tsuk.
Végeredményben azt láthatjuk,     2.14 A komplex számok  73  hogy a valós számok halmazát sikerült úgy megalkotni, hogy ebben a gazdag struktúrában már szinte minden alapművelet korlátlanul elvégezhető. Sajnos, a ”szinte” szó használata nem mellőzhető: bármennyire is fáj a szı́vünk, a dolognak van egy kis szépséghibája. Igen, tagadhatatlan, hogy a hatványozással súlyos gondok vannak, közelebbről a gyökvonással, hiszen többek között negatı́v számokból nem lehet páros kitevőjű gyököt vonni. Láthattuk, hogy √ például a −1 kefejezésnek semmi értelmes jelentést nem lehet tulajdonı́tani a valós számok halmazában, hiszen ha ez egy rendes ”szám” lenne, akkor a négyzetének −1-el kellene egyenlőnek lenni, márpedig a rendezés tulajdonságai alapján láttuk, hogy minden nullától különböző szám négyzete pozitı́v, tehát 1 pozitı́v, s ha
egyidejűleg −1 is pozitı́v lenne, akkor összegük, tehát 0 is pozitı́v volna, ami lehetetlen, hiszen a pozitı́v számok definı́ció szerint éppen a 0-nál nagyobb számok. Már ebből lehet sejteni, hogy a problémát részben az okozhatja, hogy a rendezés tulajdonságai összeegyeztethetetlenek azzal, hogy negatı́v számokból négyzetgyököt lehessen vonni. Ez azt jelenti, hogy hiába is próbálkoznánk meg a valós szám fogalmának további bővı́tésével, újabb számféleségek bevezetésével, válaszút elé kerülnénk: vagy négyzetgyököt akarunk vonni negatı́v számokból a megszokott szabályok szerint, vagy megtartjuk a rendezés jól bevált tulajdonságait, de a két dolog egyszerre nem megy. Ha tehát negatı́v számokból akarunk négyzetgyököt vonni, akkor a valós számoknak egy olyan bővı́tését kell megkonstruálnunk, ahol már nem lehet a számokat nagyság
szerint összehasonlı́tani. Persze, akkor ebben az új számkörben már annak se lesz értelme, hogy valami ”negatı́v”, hiszen ez a fogalom a rendezés alapján értelmezhető. Akkor mit is akarunk valójában? Létrehozni egy olyan számkört, ahol negatı́v számokból lehet négyzetgyököt vonni, de nincs is értelme a ”negatı́v szám” fogalmának? Ez persze teljesen értelmetlen cél. Amit mi akarunk az a következő: létrehozni egy olyan számfogalmat, amely valamilyen értelemben a valós szám fogalmának bővı́tése, de ezekből az új számokból korlátlanul lehet négyzetgyököt, sőt, akármilyen gyököt vonni. Mindezt annak tudatában tesszük, hogy cserébe le kell mondanunk arról a lehetőségről, hogy az újfajta számainkat nagyság szerint össze lehessen hasonlı́tani, a rendezés megszokott szabályai szerint. Hétköznapi nyelven ez valami olyasmit jelent, hogy még több
egyenlet megoldására lesz lehetőségünk, viszont az egyenlőtlenségekről végleg le kell mondanunk. Nos, fogadjuk el, hogy mindennek ára van, és vizsgáljuk meg, hogy milyen lesz ez az új számfogalom. A korábbi tapasztalataink azt sugallják, hogy ismét valamiféle rendezett párokkal kellene próbálkozni. Ez a fentiekben már kétszer bevált, igaz, végül nem a természetes számokból képzett rendezett párok lettek az egész számok, hanem azok bizonyos osztályai, s hasonlóan alakult a helyzet a racionális számok bevezetésekor. Mindenesetre tekintsük a valós számokból képzett összes rendezett párok halmazát Ezt a halmazt a korábban bevezetett terminológia szerint a valós számok önmagával képzett Descartes–szorzatának nevezhetjük, s jelölésére az R × R, vagy rövidebben az R2 szimbólumokat használhatjuk. Mik is ennek az elemei? Az R2 halmaz elemei az összes (a, b) rendezett
párok, ahol a, b valós számok. Két ilyen pár akkor egyenlő, ha az első komponenseik is, és a     74  A számfogalom  második komponenseik is egyenlők. A következőkben az ilyen rendezett párok között fogunk összeadást és szorzást értelmezni úgy, hogy érvényben maradjanak a 2.101 tételben felsorolt tulajdonságok közül mindazok, amelyekben az egyenlőtlenség nem szerepel, tehát csak az összeadásra és a szorzásra vonatkoznak: az (R1)-(R9) tulajdonságok. Az összeadás értelmezésével kezdjük: ha (a, b) és (c, d) az R2 két eleme, akkor összegük alatt az (a + c, b + d) rendezett párt fogjuk érteni, tehát a két rendezett párt úgymond ”komponensenként” adjuk össze: az első komponenst az elsőhöz, a második komponenst a másodikhoz adjuk hozzá, s az ı́gy kapott valós számok a megadott sorrendben képezik az összeg két komponensét. Tehát (a, b) + (c, d) = (a + c, b
+ d) . Tudjuk, hogy egy ”rendes” összeadásnál kell egy 0, amit bármihez hozzáadva annak a bárminek nem változik meg az értéke. Ez esetünkben nyilván csak a (0, 0) lehet. Továbbá, minden elemnek kell, hogy legyen negatı́vja, amit az illető elemhez hozzáadva ezt a bizonyos 0-t, tehát jelen esetben (0, 0)- kapunk eredményül. Könnyű látni, hogy esetünkben erre is csak egyetlen lehetőség van: az (a, b) elem negatı́vja szükségképpen (−a, −b) kell, hogy legyen, vagyis −(a, b) = (−a, −b) . Az Olvasóra bı́zzuk annak ellenőrzését, hogy ezekkel a definı́ciókkal összeadásunk kielégı́ti az a 2.101 tételben szereplő (R1)-(R4) tulajdonságokat A szorzás definı́ciója következik. A született optimisták természetesen azt gondolják, hogy az összeadáshoz hasonlóan, a szorzást is úgy értelmezzük, hogy komponensenként kelljen elvégezni, ám őket ki kell
ábrándı́tanunk. Ugyanis, akkor (a, b) négyzete (a2 , b2 ) lenne, tehát továbbra sem lehetne négyzetgyököt vonni olyan rendezett párokból, amelyeknek valamelyik komponense negatı́v, vagyis egy tapodtat se jutnánk előrébb programunk megvalósı́tásának útján. A szorzást lényegesen körmönfontabb módon kell értelmezni ahhoz, hogy vágyaink maradéktalanul beteljesüljenek. Évszázadoknak kellett eltelni ahhoz, hogy kikristályosodjon az az egyedül lehetséges mód, ahogy rendezett valós számpárok szorzását értelmezni kell olyan módon, hogy az egy ”rendes” szorzás legyen, tehát teljesı́tse az (R5)-(R8) tulajdonságokat, sőt, figyelembe véve az összeadás már megadott értelmezését, az (R9) tulajdonságot is, ugyanakkor minden ilyen számpár valaminek a négyzete, köbe, stb., szóval, bármilyen hatványa legyen Röviden: korlátlanul lehessen gyököt vonni akármilyen
számból, akármilyen pozitı́v egész gyökkitevő mellett. A formális értelmezés egyszerű: az (a, b) és (c, d) elemek szorzata alatt az (ac − bd, ad + bc) rendezett párt értjük, tehát (a, b) · (c, d) = (ac − bd, ad + bc) . Nehéz helyzetbe kerül az, aki meg akarja magyarázni, hogy mi vezetett arra, hogy a szorzást ezen a furfangos, természetesnek semmiképpen nem nevezhető módon értelmezzük. Még megjegyezni se túl könnyű, szemléletes jelentést     2.14 A komplex számok  75  pedig szinte lehetetlen tulajdonı́tani neki. Ám próbáljuk meg leküzdeni kezdeti nyilvánvaló ellenszenvünket, amit ezzel a kacifántos formulával kapcsolatban érzünk, és hideg fejjel vizsgáljuk meg, hogy milyen tulajdonságai vannak ennek a szorzásnak. Egyáltalán, szorzás ez? Ehhez az kell, hogy teljesüljenek az (R5)-(R9) feltételek, ám azok teljesüléséhez először valamit ki kell nevezni 1-nek, s
minden 0-tól, azaz (0, 0)-tól különböző elemnek meg kell nevezni a reciprokát. Nos, 1-nek az (1, 0) rendezett párt fogjuk nevezni, s most próbáljuk ki, hogy képes-e betölteni hivatását, tehát az imént értelmezett szorzási szabály szerint tud-e úgy viselkedni, mint ahogy az egy 1-től elvárható. Legyen tehát (a, b) tetszőleges elem az R2 -ben, és számı́tsuk ki ennek (1, 0)-val való, fentebb értelmezett szorzatát: (a, b) · (1, 0) = (a · 1 − b · 0, a · 0 + b · 1) = (a, b) , tehát, csodák csodájára, ez az 1-nek kinevezett (1, 0) pár tényleg tudja azt, amit tudnia kell: ha bármit megszorzunk vele, akkor az a bármi nem változik. Ezek után tegyük fel az (a, b) rendezett párról, hogy nem (0, 0), ugyanis reciprokát csak az ilyeneknek kell értelmezni. Persze azt se felejtsük el, hogy a reciprok fogalmába már az 1 is erőteljesen belejátszik, hiszen egy szám reciprokát pontosan az a
tulajdonsága értelmezi, hogy az illető számmal való szorzata 1. Ha tehát a és b olyan valós számok, hogy (a, b) nem a (0, 0) elem, másszóval az a és b közül legalább az egyik nem 0, akkor mondanunk kell egy olyan (c, d) párt, amelyre (a, b) · (c, d) = (1, 0) teljesül. Itt már nem kell sokat spekulálnunk, hiszen kijelölt pályán haladunk Az előbbi egyenlőség bal oldalon álló tagjának az értéke a fentiek szerint (ac − bd, ad + bc) , s ennek egyenlőnek kell lenni (1, 0)-val. Ezek szerint ac − bd = 1 és ad + bc = 0 kell, hogy teljesüljön. Középiskolás ismereteink alapján ez egy két egyenletből álló, két ismeretlent tartalmazó paraméteres egyenletrendszer, amelyben c és d az ismeretlenek, a és b a paraméterek. Nem nehéz megoldani, s azt kapjuk, hogy az egyértelmű megoldás c=  a , a2 + b2  b . d=− 2 a + b2  Ne feledjük, hogy a feltétel szerint az a és b számok közül
legalább az egyik 0tól különbözik, ı́gy az előbbi formuláknál a nevezőkben biztosan 0-tól különböző szám áll. Mit kaptunk tehát? Azt, hogy a (0, 0)-tól különböző, egyébként tetszőleges (a, b) pár reciproka csak az előbbi formulákkal leı́rt (c, d) pár lehet, másszóval a helyes definı́ció ¶ µ b a −1 ,− 2 . (a, b) = a2 + b2 a + b2     76  A számfogalom  Mi tagadás, kissé barátságtalan képlet, de talán megszeretjük, ha ellenőrizzük, hogy ezzel a választással tényleg teljesülnek az összes (R1)-(R9) azonosságok! Ezt az egyszerű számolási feladatot az Olvasóra bı́zzuk. Most már készen állunk arra, hogy értelmezzük a komplex szám fogalmát: a rendezett valós számpárok R2 halmazát az imént értelmezett összeadás és szorzás műveleteivel ellátva a komplex számok halmazának nevezzük, elemeit pedig komplex számoknak. A komplex számok
halmazát C jelöli Természetesen, mint halmaz, C és R2 ugyanaz, ugyanazok az elemeik, de a C jelöléssel azt akarjuk nyomatékosı́tani, hogy a rendezett valós számpárok egy új minőségben jelennek meg: össze lehet őket adni, és össze lehet őket szorozni, tehát ”többet tudnak”, mint az egyszerű valós számpárok. Egy (a, b) komplex szám jelölésére egyetlen szimbólumot használhatunk minden olyan esetben, amikor lényegtelen az, hogy ez a komplex szám valójában melyik rendezett valós számpárt jelenti. Hagyományosan a komplex számok jelölésére általában az angol ábécé utolsó betűit használjuk: z, w, stb. Eddigi eredményeinket a következő tételben foglaljuk össze. 2.141 Tétel A komplex számok C halmazában teljesülnek a következő tulajdonságok: bármely z, v, w komplex számok esetén (C1) z + v = v + z , (C2) z + (v + w) = (z + v) + w , (C3) z + 0 = z , (C4) z +
(−z) = 0 , (C5) z · v = v · z , (C6) z · (v · w) = (z · v) · w , (C7) z · 1 = z , (C8) z · z −1 = 1, ha z 6= 0 , (C9) z · (v + w) = z · v + z · w . Természetesen a fenti formulákban 0 a (0, 0) párt, 1 az (1, 0) párt jelenti, s a −z, illetve z −1 jelentése az, amit a fentiekben megadtunk. Ennek a tételnek a bizonyı́tását fentebb már az Olvasóra bı́ztuk. A korábban használt terminológia szerint a komplex számok halmaza a megadott műveletekkel egy testet alkot. Ez a test azonban nem rendezett test, hiszen rendezést  a korábban emlı́tett nehézségek miatt  nem lehet benne értelmezni normálisan. Meg kellene azonban vizsgálnunk, hogy ez a test, ez a számfogalom milyen kapcsolatban van a valós számokkal. Mindenekelőtt azonban egy olyan kı́sérletet végezzünk el,     2.14 A komplex számok  77  melynek eredményével kapcsolatban érthető módon furdal a kiváncsiság: vajon volt értelme ennek az
egésznek? Másszóval: lehet a komplex számok halmazában mindenből  mondjuk  négyzetgyököt vonni? Próbáljuk ki ezt például a −1-en, hiszen ebbe a problémába tört bele a bicskánk a valós számok esetében. Mit is jelöl itt a −1? Természetesen az 1 negatı́vja, ami a fenti értelmezéseink szerint −(1, 0) = (−1, 0) Tehát egy olyan (a, b) rendezett valós számpárt keresünk, amelyre (a, b) · (a, b) = (−1, 0) teljesül. Legyen a = 0, b = 1, ekkor (0, 1) · (0, 1) = (−1, 0) adódik, tehát találtunk egy olyan csodálatos komplex számot, amelynek a négyzete −1! Ez a varázslatos komplex szám olyan fontos szerepet játszik a matematikában, hogy jelölésére külön szimbólumot vezettek be, s ez az i, amit néha i helyettesı́t, ám ez lényegtelen: a (0, 1) komplex számot jelöli. Erre a komplex számra tehát fennáll az i2 = −1 egyenlőség. Mielőtt azonban minden ámulatunkat erre az
i-re pazarolnánk, vegyük észre, hogy természetesen −i is rendelkezik ugyanezzel a tulajdonsággal, hiszen a szorzás szabályai komplex számok körében is érvényesek: bármely z komplex szám esetén z-nek és −z-nek ugyanaz a négyzete: z 2 = (−z)2 . Ez azt jelenti, hogy hirtelen két olyan komplex számot is találtunk, amelyeknek −1 a négyzete: i és −i. Nem lesz ez egy kicsit sok? Esetleg vannak további aspiránsok is? Azért jó lenne ezeket valahogy áttekinteni. Ezen a ponton nem kı́vánunk ebbe a problémába részletesen belemerülni, de annyit megjegyzünk: ha n pozitı́v egész szám, akkor minden 0tól különböző komplex számnak pontosan n különböző n-edik gyöke van, azaz, pontosan n különböző olyan komplex szám van, melyek mindegyikének az nedik hatványa az adott szám. Ezek szerint minden 0-tól különböző komplex számnak pontosan három különböző köbgyöke,
négy különböző negyedik gyöke, száztizennégy különböző száztizennegyedik gyöke, stb. létezik Ezeket szépen ki lehet számolni, nem túl √ egyszerű módon, de mindenesetre világos kell, hogy legyen számunkra: az n z jelölés használata komplex z számok esetén teljességgel kerülendő, hiszen nullától különböző z és pozitı́v egész n esetén ez pontosan n különböző dolgot jelöl egyidejűleg. A valós esetben megállapodtunk, √ hogy például 2 azt az egyetlen pozitı́v számot jelenti, aminek a négyzete 2, de a komplex számok körében nincs értelme annak a kifejezésnek, hogy ”pozitı́v”. Az n darab különböző n-edik gyök egymással egyenrangú, köztük természetes módon nem lehet előnyös, vagy hátrányos megkülönböztetést tenni, olyanok, mint az ikertestvérek. A komplex számokkal kapcsolatban még néhány elnevezésről, illetve
jelölésről kell szót ejteni. Minthogy a komplex számok rendezett párok, ı́gy van első és második komponensük. A z = (a, b) komplex szám első komponensét, a-t a z valós részének, második komponensét, b-t pedig a z képzetes részének nevezzük. Jelben: Re z = a, Im z = b, ahol Re a ”reális rész”, Im az ”imaginárius rész” kezdő szavára utal. Ily módon tehát azt ı́rhatjuk, hogy z = (Re z, Im z) A fenti z komplex szám konjugáltjának nevezzük a z = (a, −b) komplex számot. Tehát Re z = Re z és Im z = −Im z teljesül minden z komplex szám esetén.     78  A számfogalom  A következő feladat annak megvizsgálása, hogy milyen értelemben tekinthetjük a komplex számok halmazát a valós számok halmaza kibővı́tésének. A korábbiakban láttuk, hogy ez úgy szokás érteni, hogy az új számhalmaznak van egy olyan része, amely pontosan ugyanúgy viselkedik, mint a régi,
tehát azzal azonosnak tekinthető. Nos, a komplex számok halmazában tekintsük azt a részhalmazt, amly mindazon komplex számokból áll, melyeknek a képzetes része 0. Jelölje ezt a részhalmazt R0 , tehát R0 = {z|z ∈ C , és Im z = 0} . Az R0 halmaz tehát a z = (a, 0) alakú rendezett párokból áll. Két ilyen összege és szorzata ugyancsak ilyen alakú, egész pontosan (a, 0) + (b, 0) = (a + b, 0) ,  (a, 0) · (b, 0) = (a · b, 0)  teljesül, amint azt az összeadás és a szorzás értelmezése alapján könnyen ellenőrizhetjük. Az R0 halmaz tehát ugyancsak test, s mivel a (0, 0) és az (1, 0) hozzátartoznak R0 -hoz, ı́gy R0 a C egy részteste. Ez számunkra azt jelenti, hogy az a ↔ (a, 0) megfeleltetés révén azonosı́thatjuk R-t R0 -al, hiszen a műveletek e két testben ”ugyanúgy” működnek. Ez a pontos értelme annak a kijelentésnek, hogy a valós számok egyben komplex számok is, amit R ⊆ C
módon fejezhetünk ki. Természetesen valójában az R ⊂ C reláció érvényes, s a korábbi számhalmazokkal együtt az N⊂Z⊂Q⊂R⊂C összefüggés ı́rható fel, mely a lehető legtömörebben fejezi ki a számfogalom felépı́tése során elért eredményt. Tehát az Im z = 0 tulajdonságú komplex számokat ezentúl nyugodtan nevezhetjük valós számoknak. Ezek egyébként nyilván a z = z tulajdonsággal is jellemezhetők. Ha tehát az (a, 0) komplex szám helyett ezentúl simán a-t ı́runk, akkor teljesen jogos a (0, 0) helyett 0-t, az (1, 0) helyett pedig 1-et ı́rni. Így a z = (a, b) komplex szám a következő alakban is ı́rható: z = (a, b) = (a, 0) + (0, b) = a · (1, 0) + b · (0, 1) = a + b · i ,  (26)  ahol i a korábban bevezetett jelölésnek megfelelően a (0, 1) komplex számot jelenti. A (26) felı́rást a z komplex szám kanonikus alakjának szokás nevezni Ennek az az előnye, hogy az
ilyen alakban felı́rt komplex számokkal úgy kell elvégezni a műveleteket, mint azt a középiskolában tanultuk a többtagú kifejezésekkel való számolás során. Tehát az a + b i és c + d i komplex számok összeadásakor az ”egynemű” tagokat kell összegyűjteni: (a + b i) + (c + d i) = (a + c) + (b + d) i , szorzáskor pedig a ”minden tagot minden taggal” szabályt kell alkalmazni annak figyelembevételével, hogy i · i = −1: (a + b i) · (c + d i) = a · c + a · d i + b i · c + b i · d i = (ac − bd) + (ad + bc) i .     2.14 A komplex számok  79  Így már értelmet nyer a szorzás definiálásakor még indokolhatatlannak tűnő formula: már akkor az járt a fejünkben, hogy az (a, b) pár valójában egy a + b i alakú összetett, ”komplex” kifejezést akar jelölni, amivel majd ı́gy kell számolni, hogy i · i = −1 teljesüljön. Kanonikus alakban felı́rt komplex számok osztásakor egy
egyszerű trükköt szokás alkalmazni, ami ugyancsak ismert a középiskolából az olyan törtkifejezésekkel kapcsolatban, melyeknek a nevezőjében egy kéttagú összeg áll, s az egyik tag négyzetgyököt tartalmaz. Ilyenkor az szokott lenni a feladat, hogy ”gyöktelenı́tsük a nevezőt”. Például √ √ √ 3 · (2 − 5) 6−3 5 3 √ = √ = √ = −6 + 3 5 , (4 − 5) 2+ 5 (2 + 5) · (2 − 5) tehát ”bővı́tjük” a törtet, azaz, számlálóját megszorozzuk √ és nevezőjét egyaránt √ ugyanazzal a számmal, jelen esetben 2 − 5-el, amit a 2 + 5 ”konjugáltjának” szoktak nevezni, s ez természetesen nem azonos a komplex szám konjugáltjával, de amint látni fogjuk, a szerepe teljesen hasonló. Ezután az (a+b)(a−b) = a2 −b2 azonosság felhasználásával a nevezőből eltűnik a kellemetlen négyzetgyök. Nos, kanonikus alakban felı́rt komplex számok osztásakor lényegében
ugyanezt kell csinálni. Magyarázkodás helyett álljon itt egy konkrét példa, ami önmagáért beszél: 3 3 · (2 − 5 i) 6 − 15 i = −6 + 15 i . = = 2 + 5i (2 + 5 i) · (2 − 5 i) (4 − 5) Komplex számok nem egész kitevőjű hatványozása, illetve a komplex számokból való gyökvonás jóval bonyolultabb, e műveletekhez nem a kanonikus alakot, hanem a komplex számok egy másfajta felı́rását szokás felhasználni, ennek részleteibe azonban itt nem mehetünk bele. Végezetül térjünk vissza röviden a valós számok geometriai interpretációjára, amely a számegyenes fogalmához vezetett. Vajon lehet-e a komplex számokat is valamilyen geometriai modell segı́tségével szemléltetni? A komplex számok nyilván nem férnek el a számegyenesen, hiszen, mint láttuk, azt már a valós számok teljesen kitöltik. Ugyanakkor ne feledjük, hogy a komplex számok valójában valós számokból képzett
rendezett párok, ami arra nyújt lehetőséget, hogy a komplex számokat a sı́k pontjaival hozzuk összefüggésbe. Mint azt a koordinátageometriából tudjuk, a sı́k pontjai ugyancsak rendezett valós számpárokkal jellemezhetők egy adott sı́kbeli derékszögű koordnátarendszer rögzı́tése után. Ezek szerint, áttételesen, minden z = (a, b) = a + b i komplex szám elképzelhető úgy, mint a sı́knak az (a, b) koordináta-párral jellemzett pontja, s megfordı́tva, a sı́k minden pontjának megfelel egy komplex szám, nevezetesen az, amelynek valós része az illető pont első, képzetes része pedig az illető pont második koordinátája. A derékszögű koordinátarendszerünket tehát úgy foghatjuk fel, mint amelynek vı́zszintes tengelyén az adott komplex szám valós részét, függőleges tengelyén pedig a képzetes részét mérjük fel. Ennek megfelelően a vı́zszintes tengelyt valós
tengelynek, a függőlegeset pedig képzetes tengelynek is szokás nevezni. A valós tengelyen az egység 1, a képzetes tengelyen pedig i Ennek meg-     80  A számfogalom  felelően az i komplex számot képzetes egységnek, vagy imaginárius egységnek is szokás nevezni. A valós számok a valós tengelyen helyezkednek el, mı́g a képzetes tengelyen található számok az úgynevezett tiszta képzetes, vagy imaginárius számok. Még tovább mehetünk a geometriai interpretáció során, ha felidézzük, hogy a rendezett valós számpárok valójában a sı́k origóból kiinduló vektoraival is azonosı́thatók. Az (a, b) rendezett valós számpár tehát úgy is felfogható, mint a sı́k egy pontja, úgy is mint az az origóból kiinduló vektor, melynek végpontja ez a pont, s végül úgy is, mint az a+b i komplex szám. Ennek a felfogásnak további előnyei is vannak. Nevezetesen, könnyen látható, hogy ha
a komplex számokat a sı́k vektoraiként fogjuk fel, akkor például a komplex számok összeadása éppen e vektorok összeadásának felel meg. Egy komplex szám valós része a megfelelő vektor vı́zszintes, mı́g képzetes része a vektor függőleges irányú összetevője. Egy komplex szám konjugáltja az illető vektornak a vı́zszintes tengerre vonatkozó tükörképét reprezentálja. Megjegyezzük, hogy a komplex számok szorzása némileg bonyolultabban, de ugyancsak természetes módon szemléltethető ebben a vektoros felfogásban, ám ennek részleteire itt nem térhetünk ki. Láthattuk, hogy a komplex számok halmaza egy rendkı́vül gazdag struktúra, az aritmetika összes műveletei korlátlanul elvégezhetők benne. Ám mégis felvetődhet a kérdés: lehet-e esetleg ennek a struktúrának valami olyan algebrai értelemben vett hátrányát találni, ami esetleg még további bővı́tést
tenne szükségessé? Bár ez a dolog nincs túl precı́zen megfogalmazva, de valami olyasmire lehetünk kiváncsiak, hogy nem kell-e félnünk algebrai számı́tásaink során attól, hogy megint valami olyan problémába ütközünk, amelynek megoldására még a komplex számok körében sincs elvi lehetőség. Gondoljunk például arra, hogy a gyakorlati algebrai problémák számos esetben úgynevezett egyenletek megoldására vezetnek. Az egyenletek különböző tı́pusaival a későbbiekben fogunk részletesebben foglalkozni, de középiskolai tapasztalataink alapján tudjuk, hogy a felmerülő problémák jelentős része elsőfokú, másodfokú, esetenként magasabb fokú egyenletek, illetve ilyenekből álló egyenletrendszerek megoldásához vezet. Azt is megtanultuk, hogy az elsőfokú egyenletek, illetve egyenletrendszerek megoldásának problémája a valós számok körében megoldottnak
tekinthető: ha egy ilyen probléma nem ellentmondásos, akkor meg is tudjuk oldani, tehát meg tudjuk határozni az összes megoldását. Ugyanakkor sajnos már a másodfokú egyenletek esetében komoly gondok vannak: nagyon egyszerű olyan másodfokú egyenletet felı́rni, amelynek az együtthatói valós számok, sőt, ha akarjuk, pozitı́v egész számok, és mégsem oldható meg a valós számok körében. Ilyen az az eset, amikor a másodfokú egyenlet megoldóképletében fellépő négyzetgyök alatti kifejezés, az úgynevezett diszkrimináns, negatı́v szám, márpedig ez nagyon könnyen előfordulhat. Azt már jól tudjuk, hogy ha csak ennyi volna a probléma, akkor ezt a komplex számok körében simán tudnánk kezelni: a komplex számok körében mindenből lehet négyzetgyököt vonni, ı́gy egy másodfokú egyenletnek a megoldóképlete nem mond csődöt akkor sem, ha a négyzetgyök alatt
negatı́v valós szám áll. Ám azt nem tudhatjuk, hogy mi a     Közepek és egyenlőtlenségek  81  helyzet magasabb fokú egyenletek esetében, hiszen azokra általában még megoldóképlet se létezik. Nos, a komplex számok egy egészen különleges tulajdonsága folytán a komplex számkörben akárhanyadfokú egyenleteknek van megoldása, bármilyen komplex számok is az együtthatók. Ezt a tulajdonságot úgy szokás fogalmazni, hogy a komplex számok teste algebrailag zárt Tehát, ameddig csupán algebrai egyenleteket, vagy egyenletrendszereket akarunk megoldani, addig nem kell félnünk attól, hogy újabb számok bevezetésére lesz szükség: a komplex számkört sikerült olyan gazdagra készı́teni, hogy ezek a problémák benne teljesen megoldhatók.  2.15  Közepek és egyenlőtlenségek  A köznapi életben gyakran találkozunk azzal a problémával, hogy egy számhalmaz átlagát kell
kiszámı́tani. A számhalmazról természetesen feltételezzük, hogy véges sok számot tartalmaz, s az átlagolás leggyakoribb módja a számtani közép kiszámı́tása. Ezt a következő módon értelmezzük: legyen n pozitı́v egész szám és legyenek x1 , x2 , .   , xn tetszőleges valós számok Ezek számtani közepe, vagy aritmetikai közepe alatt az A=  x1 + x2 + · · · + xn n  (27)  valós számot értjük. Könnyű belátni, hogy ez a szám valóban ”közép” abban az értelemben, hogy értéke mindig az x1 , x2 , .   , xn számok legkisebbike és legnagyobbika közé esik Más vonatkozásban másfajta átlagolási technikák is előfordulnak, melyekhez más tı́pusú közepeket szokás használni Az ilyenek közül leggyakrabban a mértani, illetve a harmonikus középpel szoktunk találkozni, melyek értelmezése a következő módon történik: legyen n pozitı́v egész szám és
legyenek x1 , x2 , .   , xn pozitı́v valós számok Ezek mértani közepe, vagy geometriai közepe alatt a 1 (28) G = (x1 · x2 · · · · · xn ) n valós számot értjük, mı́g harmonikus közepük alatt a n H= 1 1 1 x1 + x2 + · · · + xn  (29)  valós számot. A számtani középhez hasonlóan ezekről is elmondható, hogy értékük mindig az x1 , x2 ,    , xn számok legkisebbike és legnagyobbika közé esik A felsorolt középértékek természetesen különböző tulajdonságokkal rendelkeznek és a gyakorlati élet különböző területein használatosak. Felvetődik a kérdés, hogy vajon ugyanazon számoknak a különböző közepeit nagyság szerint össze lehet-e hasonlı́tani? Például, jobban járnának-e a diákok, ha a tanulmányi átlagukat nem a számtani, hanem mondjuk a mértani, vagy a harmonikus közép segı́tségével számolnák ki? Ezt az összehasonlı́tási problémát a
következő tételekben oldjuk meg. Nyilván az összehasonlı́tásnak csak pozitı́v számok esetén van értelme, hiszen a két utóbbi közép csak ilyen számokra van értelmezve. Először azonban szükségünk van egy fontos egyenlőtlenségre     82  A számfogalom  2.151 Tétel (Bernoulli–egyenlőtlenség) Legyen n pozitı́v egész szám, x > −1 pedig valós szám. Ekkor (1 + x)n ≥ 1 + n · x . (30) Bizonyı́tás. A bizonyı́tást n szerinti teljes indukcióval végezzük el Az állı́tás n = 1 esetén nyilvánvaló. Tegyük fel, hogy igazoltuk már az egyenlőtlenséget valamely n ≥ 1 számra. Ekkor az (1 + x)n ≥ 1 + n · x egyenlőtlenség mindkét oldalát szorozzuk meg az 1 + x pozitı́v számmal, hogy a következőt kapjuk: (1 + x)n+1 = (1 + x)n · (1 + x) ≥ (1 + n · x) · (1 + x) = 1 + n · x + x + n · x2 = = 1 + (n + 1) · x + n · x2 . Az utolsó tag nyilván nagyobb, vagy egyenlő mint 1 +
(n + 1) · x, hiszen n · x2 nem negatı́v szám, s ezzel az állı́tást bebizonyı́tottuk.  2.152 Tétel Legyen n pozitı́v egész szám, s legyenek x1 , x2 ,    , xn pozitı́v valós számok. Ekkor 1  (x1 · x2 · · · · · xn ) n ≤  x1 + x2 + · · · + xn . n  (31)  Egyenlőség akkor és csak akkor áll fenn, ha x1 = x2 = · · · = xn . Bizonyı́tás. Mivel nyilván mind a számtani, mind a mértani közép értéke független a számok sorrendjétől, ı́gy feltehetjük, hogy számaink nagyság szerint vannak rendezve: x1 ≤ x2 ≤ · · · ≤ xn . Az állı́tást teljes indukcióval bizonyı́tjuk, s n = 1-re nyilván igaz. Legyen An =  x1 + x2 + · · · + xn , n  1  Gn = (x1 · x2 · · · · · xn ) n ,  s tegyük fel, hogy a Gn ≤ An egyenlőtlenséget már igazoltuk. Azt kell megmutatnunk, hogy x1 · x2 · · · · · xn+1 ≤ An+1 n+1 . Vegyük észre, hogy An+1 = An + s ezért  xn+1 − An , n+1  µ ¶n+1 xn+1 − An
xn+1 − An . ≥1+ n+1 = 1 + (n + 1)A An An n An+1 n+1     2.15 Közepek és egyenlőtlenségek  83  Az utolsó lépésben a Bernoulli–egyenlőtlenséget használtuk. Ezt megtehettük, hiszen a feltevés szerint xn+1 − An ≥ 0. Innen az adódik, hogy An+1 n+1 ≥ An + xn+1 − An = xn+1 , Ann s ezért n An+1 n+1 ≥ An · xn+1 ≤ x1 · x2 · .   xn · xn+1  az indukciós feltevés miatt, s ezzel az állı́tást igazoltuk. A bizonyı́tásból látható, hogy az egyenlőségre vonatkozó állı́tás is igaz. A tétel szerint pozitı́v számok mértani közepe sohasem nagyobb számtani közepüknél, s azzal egyenlő csak akkor lehet, ha a számok egyenlők. Mi a helyzet a harmonikus középpel? 2.153 Tétel Legyen n pozitı́v egész szám, s legyenek x1 , x2 ,    , xn pozitı́v valós számok. Ekkor n  1  1 1 1 x1 + x2 + · · · + xn  ≤ (x1 · x2 · · · · · xn ) n .  (32)  Egyenlőség akkor és csak akkor áll fenn, ha
x1 = x2 = · · · = xn . Bizonyı́tás. Alkalmazzuk az imént bizonyı́tott számtani és mértani közép közti egyenlőtlenséget az x11 , x12 , .   , x1n pozitı́v számokra, ekkor azt kapjuk, hogy µ  1 1 1 · · ··· · x1 x2 xn  ¶ n1  1  ≤ x1  + x12 + · · · + x1n n  .  Mindkét oldal reciprokát véve éppen az állı́tást kapjuk. Az x1 , x2 , .   , xn pozitı́v számok H harmonikus, G mértani és A számtani közepei között tehát az alábbi egyenlőtlenség áll fenn: H ≤ G ≤ A. Ezek szerint a diákok mégiscsak akkor járnak a legjobban, ha tanulmányi átlagukat e három közép közül a számtani közép segı́tségével, tehát a hagyományos módon számı́tják ki. Megjegyezzük, hogy a számtani közép valójában közepek egy széles osztályának, az úgynevezett hatványközepeknek egy speciális esete. Ha n pozitı́v egész szám, x1 , x2 , .   , xn pozitı́v valós
számok, α pedig 0-tól különböző valós szám, akkor az x1 , x2 , .   , xn számok α-adik hatványközepe alatt a következő kifejezést szokás érteni: ¶1 µ α α α x1 + xα 2 + · · · + xn . (33) K(α) = n     84  A számfogalom  Ezek szerint K(1) = A, a számtani közép. A K(2) közepet kvadratikus középnek is szokták nevezni. Felhı́vjuk a figyelmet arra, hogy α nem feltétlenül pozitı́v egész szám, értéke bármilyen 0-tól különböző valós szám lehet. Ugyanakkor ebben a közép-osztályban még érdekesebben vetődik fel az összehasonlı́tási probléma: vajon ugyanazoknak az x1 , x2 , .   , xn pozitı́v számoknak a különböző α értékekhez tartozó hatványközepei hogyan függnek az α értékétől: vajon α növekedésével ezek a közepek nőnek, vagy csökkennek? Nos, meg lehet mutatni, hogy a kitevő növekedésével a hatványközepek nőnek, ı́gy a
diákok még a jelenlegi helyzetnél is jobban járnának, ha az α = 1 kitevőnek megfelelő K(1) = A számtani közép helyett valamilyen 1-nél nagyobb α-t választanának a hatóságok a tanulmányi átlag kiszámı́tására. Az állandó reformhangulatban előbb-utóbb bizonyára ez is eszébe jut majd valami minisztériumi tisztviselőnek.     85  3  A FÜGGVÉNYTAN ELEMEI  3.1  Függvények  A függvény a matematika egyik legalapvetőbb fogalma. Szinte nincs olyan területe a matematikának és alkalmazásainak, ahol ne bukkannának fel függvények, esetleg különböző ”álneveken”, mint például ”leképezés”, ”hozzárendelés”, ”megfeleltetés”, stb. Ezek a kifejezések mind ugyanazt a fogalmat jelentik, ı́gy egyiket sem lehet a másik segı́tségével megmagyarázni, értelmezni. Legyenek A és B tetszőleges halmazok. Ekkor az A × B Descartes–féle szorzathalmaz egy tetszőleges
részhalmazát relációnak nevezzük. Kicsit pontosabb lenne azt mondani, hogy egy ilyen részhalmaz ”reláció A-ból B-be”, hiszen itt A és B szerepe nem szimmetrikus. Egy ”reláció B-ből A-ba” a B × A halmaz egy részhalmazát jelenti, s tudjuk, hogy A × B általában különbözik B × A-tól. Ha A = B, akkor ahelyett, hogy ”reláció A-ból A-ba” azt mondjuk, hogy ”reláció A-n”. Tehát egy reláció A-ból B-be olyan (a, b) rendezett elempárok R halmaza, melyeknél a az A-hoz, b pedig B-hez tartozik. Például az üres halmaz tetszőleges A, B halmazok esetén egy reláció A-ból B-be, melyhez egyetlen elempár sem tartozik. Egy másik példa maga A × B, tehát az összes lehetséges rendezett elempárok halmaza. Egy további példa tetszőleges A halmaz esetén az identikus reláció A-n, mely az összes (a, a) párok halmaza, ahol a az A tetszőleges eleme. Ezt idA módon szokás jelölni.
Tehát idA = {(a, a)| a ∈ A} . Ha R ⊆ A × B egy adott reláció és (a, b) az R-hez tartozik, akkor azt mondjuk, hogy a relációban van b-vel az R reláció szerint. Tehát az ”R-hez tartozás” egyfajta kapcsolatot hoz létre az a és b között: azt a kapcsolatot, hogy (a, b) az R-hez tartozik, mı́g mondjuk (a, c) nem tartozik R-hez, valamely másik B-beli c elem esetén. Például az A × B reláció minden A-beli a-t minden B-beli b-vel kapcsolatba hoz, tehát ez egy meglehetősen semmitmondó kapcsolat, viszont az üres halmaz, mint reláció rendkı́vül szigorú ”kapcsolatot” jelent: nem is lehet neki eleget tenni. Világos az identikus reláció által létrehozott kapcsolat is: ez azt jelenti, hogy az elempár két komponense egyenlő egymással, vagyis ez a reláció valójában az ”egyenlőség” fogalmát testesı́ti meg. Látható, hogy a reláció egy meglehetősen általános fogalom, első
ránézésre talán nem is egészen érthető, hogy mire jó, mit lehet vele kezdeni, hiszen tulajdonképpen csupán két halmaz Descartes–szorzatának részhalmazaira vezettünk be egy új elnevezést. Valójában nem is a relációkkal akarunk itt foglalkozni, de hamarosan kiderül, hogy a függvény fogalma valójában a reláció egy speciális esete. Ennek fényében próbáljuk megérteni a következő néhány fogalmat Ha R ⊆ A × B egy adott reláció, akkor az R értelmezési tartományának nevezzük mindazon A-beli a elemek halmazát, melyekhez van olyan B-beli b, hogy (a, b) az R-hez tartozik. Tehát az R reláció értelmezési tartománya az R-beli elempárok első komponenseiből álló halmaz; ez természetesen az     86  A függvénytan elemei  A halmaz egy részhalmaza. Hasonlóan, ha R ⊆ A × B egy adott reláció, akkor az R értékkészletének nevezzük mindazon B-beli b elemek halmazát,
melyekhez van olyan A-beli a, hogy (a, b) az R-hez tartozik. Tehát az R reláció értékkészlete az R-beli elempárok második komponenseiből álló halmaz; ez nyilván a B halmaz egy részhalmaza. Az R reláció értelmezési tartományát tehát az A-nak azok az elemei alkotják, melyekhez egyáltalán tartozik B-beli elem, mı́g az értékkészlet a B mindazon elemeiből áll, amelyek egyáltalán tartoznak valamely A-beli elemhez. Világos, hogy az üres halmaznak, mint relációnak az értelmezési tartománya és az értékkészlete egyaránt az üres halmaz, mı́g az A×B reláció értelmezési tartománya A, értékkészlete pedig B. Az identikus reláció értelmezési tartománya és értékkészlete az A halmazon maga az A halmaz. Ha R ⊆ A × B egy adott reláció, akkor tetszőleges A-beli a esetén R(a) fogja jelölni mindazon B-beli b elemek halmazát, melyek az a-val relációban állnak,
tehát R(a) = {b| (a, b) ∈ B} , melyet az a elem képének nevezünk az R relációnál. Világos, hogy ez a halmaz akkor és csak akkor nem az üres halmaz, ha a az R értelmezési tartományához tartozik, valamint R(a) mindig részhalmaza az R értékkészletének. Ezt a jelölést kiterjeszthetjük az A elemeiről az A részhalmazaira a következő módon: ha A0 az A tetszőleges részhalmaza, akkor R(A0 ) jelenti az A0 -beli elemek képeinek egyesı́tési halmazát, másszóval [ R(A0 ) = R(a) . a∈A0  Az R(A0 ) halmazt az A0 halmaz képhalmazának, vagy röviden képének nevezzük az R relációnál. Talán most már kezd világosodni, hogy a függvény értelmezéséhez miért van szükség a reláció fogalmára: a reláció pontosan a függvényekkel kapcsolatban oly gyakran emlegetett homályos ”hozzárendelés” akar lenni. Az értelmezési tartomány egy a eleméhez a B halmaz R(a)-hoz tartozó
elemei vannak ”hozzárendelve” éppen azáltal, hogy ők állnak relációban a-val. A gond csak az, hogy az ilyen ”hozzárendelést” nem nagyon szeretjük ”függvénynek” nevezni akkor, ha az R(a) halmaz, tehát az a elem képe egynél több elemet tartalmaz: a függvényekkel kapcsolatban alapvető követelmény szokott lenni, hogy egy dologhoz csak egy dolog legyen ”hozzárendelve”. Nos, nem is akarunk mi minden relációt függvénynek nevezni: az R relációt akkor nevezzük függvénynek, ha az R értelmezési tartományának minden a eleme esetén az R(a) halmaz egyetlen elemet tartalmaz. Mivel az értelmezési tartományhoz tartozó a elem esetén R(a) biztosan nem üres, ı́gy ez a feltétel azt jelenti, hogy R(a)-nak legfeljebb egy eleme van. Másszóval, az R reláció pontosan akkor függvény, ha bármely R-beli (a, b) és (a, c) elemek esetén b = c. Ebben az esetben megállapodunk abban, hogy R(a) nem
az a elem képét tartalmazó egyelemű halmazt, hanem magát ezt az egyetlen elemet, tehát az a elem képét fogja jelölni. Ha az R függvény     Inverz függvény  87  értelmezési tartománya az A halmaz, értékei pedig a B halmazban vannak, akkor ezt ı́gy jelöljük: R : A  B. Felhı́vjuk a figyelmet, hogy ennél a jelölésnél tehát A az R értelmezési tartománya, de B nem feltétlenül az értékkészlete: az R reláció értékkészlete a B halmaz részhalmaza. Nyilván mindenki számos példát tudna felsorolni függvényekre, de itt talán néhány olyan példát célszerű emlı́teni, amelyek a relációk körében mutatják a függvények különbözőségét. A fentiekben emlı́tettük például azt a relációt, melyet tetszőleges A, B halmazok esetén az üres halmaz testesı́t meg, mely természetesen A×B részhalmaza. Ennek a relációnak értelmezési tartománya és
értékkészlete egyaránt az üres halmaz. Persze, ettől azért még lehet függvény: valóban, az üres halmaz, mint reláció, teljesı́ti a függvényekre rótt feltételt, hiszen nem fordul elő, hogy az értelmezési tartományának valamely a eleme esetén az a képe egynél több elemet tartalmaz. Egy másik példa a fentiekből az adott A, B halmazok esetén az R = A × B reláció. Ennek értelmezési tartománya az A, értékkészlete pedig a B halmaz Világos, hogy ha az A halmaz nem üres, a B halmaz pedig legalább két elemet tartalmaz, akkor ez a reláció nem függvény. Ha A üres, akkor az előbbi függvényt kapjuk, ha pedig A nem üres és B egyetlen elemet tartalmaz, akkor függvényt kapunk, melynek értékkészlete egyetlen elemből áll. Általában azokat a függvényeket, amelyeknek az értékkészlete egyetlen elemet tartalmaz, konstans függvényeknek nevezzük. Ugyancsak szerepelt a
fentiekben tetszőleges A halmaz esetén az idA reláció, melynek értelmezési tartománya és értékkészlete egyaránt az A halmaz. Ez a reláció természetesen bármely A halmaz esetén függvény: minden A-beli a esetén idA (a) = a. Ez tehát újdonsült jelöléseink használatával ı́gy is ı́rható: az az idA : A  A függvény, melyre idA (x) = x teljesül minden A-beli x esetén.  3.2  Inverz függvény  A függvényelmélet alapfogalmai közül néhány továbbinak a bevezetése következik, ám ezeket a fogalmakat is először célszerű a relációk körében értelmezni. Legyen adott az R ⊆ A × B reláció. Ekkor a {(b, a)| (a, b) ∈ R} relációt a B × A halmazon az R reláció inverzének nevezzük és R−1 -el jelöljük, valamint ”er ad mı́nusz egy” módon olvassuk. Minden relációnak van tehát inverze, ami ugyancsak egy reláció, s könnyű látni, hogy az R−1
értelmezési tartománya éppen R értékkészlete, értékkészlete pedig az R értelmezési tartománya. Ha B0 a B halmaz egy részhalmaza, akkor az R−1 (B0 ) halmazt, ami tehát a B0 halmaz képhalmaza az R−1 relációnál, a B0 halmaz ősképének nevezzük az R relációnál. Felvetődik a kérdés, hogy vajon egy halmaz képének az ősképe megegyezik az eredeti halmazzal? Pontosabban, ha R¡ ⊆ A ×¢B egy reláció és A0 az A egy részhalmaza, akkor vajon fennáll az R−1 R(A0 ) = A0 egyenlőség? Szemléletesen könnyen beláthatjuk, hogy ez általában nem igaz,     88  A függvénytan elemei  hiszen ha veszünk egy halmazt az R reláció értelmezési tartományában, akkor nem biztos, hogy ezen halmaz elemeinek képei csakis ezen halmaz elemeinek lehetnek képei: lehetséges, hogy valamilyen más elemnek is ugyanaz a képe, amely tehát az őskép elkészı́tésénél az eredeti halmaznál bővebb
halmazt is eredményezhet. Javasoljuk az Olvasónak, hogy részletesebben vizsgálja meg ezt a problémát. Az értelmezésből világos, hogy egy reláció és inverze teljesen szimmetrikus szerepet játszanak, másszóval bármely reláció inverzének az inverze maga az eredeti reláció. Képletben: ¡ −1 ¢−1 R =R teljesül minden R reláció esetén. Tekintsünk néhány konkrét példát. A fentiekben emlı́tett három reláció esetében adott A, B halmazok esetén az A × B halmazon tekintett üres reláció inverze ugyancsak az üres reláció, ám a B ×A halmazon, az A×B reláció inverze pedig a B × A reláció. Az A halmazon értelmezett idA reláció inverze önmaga: id−1 A = idA . Lássunk most egy újabb példát relációra, illetve inverzére. Legyen ezúttal A = B = N, a természetes számok halmaza, K pedig a következő módon értelmezett reláció: az (m, n) rendezett pár, ahol m, n
természetes számok, pontosan akkor tartozik a K relációhoz, ha m ≤ n. Képletben: {(m, n)| m, n ∈ N , m ≤ n} . Ez a reláció tehát a ”kisebb, vagy egyenlő” reláció a természetes számok halmazán. Értelmezési tartománya és értékkészlete egyaránt a természetes számok halmaza. Azt is könnyű látni, hogy ennek a relációnak éppen a hasonló módon értelmezett ”nagyobb, vagy egyenlő” reláció az inverze, hiszen m ≤ n pontosan akkor teljesül, ha n ≥ m. Legyen ismét A = B = N, a természetes számok halmaza, továbbá az (m, n) rendezett pár, ahol m, n természetes számok, pontosan akkor tartozzon az N relációhoz, ha n = m2 . Képletben N = {(m, m2 )| m ∈ N} . Ez tehát a ”négyzetre emelés” reláció a természetes számok halmazán. Mivel bármely m természetes szám esetén az N (m) halmaz, tehát az m elem képe egyetlen elemet, nevezetesen az m2 természetes számot
tartalmazza, ı́gy ez a reláció függvény: N : N  N és N (m) = m2 , minden m természetes szám esetén. Ennek a függvénynek az értelmezési tartománya tehát a természetes számok halmaza, mı́g értékkészlete a négyzetszámok halmaza. Vizsgáljuk meg most az N −1 reláció jelentését: N −1 = {(m2 , m)| m ∈ N} ,     Összetett függvény  89  ami a ”négyzetgyökvonás” reláció, értelmezési tartománya a négyzetszámok halmaza, értékkészlete pedig a természetes számok halmaza. Ez a reláció ugyancsak függvény, hiszen minden olyan természetes számhoz, amely négyzetszám, pontosan egy olyan természetes szám található, melynek ő a négyzete. Ugyanakkor, ha a ”négyzetre emelés” relációt nem a természetes számok, hanem az egész számok halmazán, tehát Z × Z-n nézzük, akkor láthatjuk, hogy annak inverze már nem függvény, hiszen beletartozik például
(1, 1) és (1, −1). Ezek a példák azt mutatják, hogy egy függvény inverze  mely mindig egy reláció  lehet, hogy függvény, de az is lehet, hogy nem. Másrészt, az is előfordulhat, hogy egy olyan relációnak, mely nem függvény, az inverze függvény. Láttunk tehát példát olyan függvényre, melynek inverze nem függvény, és olyanra is, melynek inverze függvény. Az utóbbiak alapvető szerepet játszanak: ezeket kölcsönösen egyértelmű, vagy egy-egyértelmű függvényeknek nevezzük. Az f : A  B függvény tehát akkor kölcsönösen egyértelmű, ha az A halmaz bármely a 6= b elemei esetén f (a) 6= f (b) következik. Másszóval, különböző elemek képei különbözők Szokás az ilyen függvényeket injektı́vnek, vagy invertálhatónak is nevezni. Ha az f : A  B függvény olyan, hogy értékkészlete B, akkor f -et szürjektı́vnek mondjuk, s ha f egyidejűleg injektı́v
és szürjektı́v, akkor bijektı́v. Itt tehát lényeges, hogy mi a függvény értékkészlete: minden injektı́v függvény bijektı́v a saját értelmezési tartománya és értékkészlete vonatkozásában, tehát minden injektı́v függvény bijektı́v módon képezi értelmezési tartományát saját értékkészletére. Az eddigiekből látható, hogy minden injektı́v függvény inverze is injektı́v, s ugyanez érvényes, ha az ”injektı́v” szót ”bijektı́v”-re cseréljük. Ha tehát az f : A  B függvény injektı́v, akkor az f (a) = b egyenlőség jelentése ugyanaz, mint az f −1 (b) = a egyenleté. Az a gyakran használt kifejezés, hogy ”kölcsönösen egyértelmű megfeleltetés”, vagy ”két halmaz elemeinek kölcsönösen egyértelmű egymáshoz rendelése” annyit jelent, hogy a két halmaz között adott egy bijektı́v függvény, melynek az egyik halmaz az
értelmezési tartománya, a másik pedig az értékkészlete. A két halmaz ebben a vonatkozásban szimmetrikus szerepet játszik, hiszen ha f : A  B bijektı́v, akkor nyilván f −1 : B  A is bijektı́v. A fentiekben emlı́tett példák közül az üres halmaz, mint függvény, természetesen bijektı́v, s ugyanez érvényes bármely A halmaz esetén az idA függvényre. Sőt, mint láttuk, ez a függvény saját magának inverze. A négyzetre emelést leı́ró N : N  N függvény injektı́v, de nem szürjektı́v, ı́gy nem bijektı́v.  3.3  Összetett függvény  Az elemi függvénytanból ismerjük az összetett függvény fogalmát. Ezt a fontos fogalmat is először a relációk körében értelmezzük. Legyenek adottak az R ⊆ A × B és S ⊆ C × D relációk. Itt A, B, C, D     90  A függvénytan elemei  tetszőleges halmazok. Értelmezzünk egy relációt az A × D halmazon úgy, hogy azok az (a,
d) rendezett párok tartozzanak hozzá, melyekhez van olyan b eleme a B halmaznak, melyre (a, b) az R relációhoz, (b, d) pedig az S relációhoz tartozik. Ezt a relációt fogjuk az S és R relációk ebben a sorrendben vett összetételének, vagy kompozı́ciójának nevezni. Jele: S ◦ R, melyet az S-ből és R-ből összetett relációnak nevezünk. Felhı́vjuk a figyelmet, hogy itt az S és R relációk sorrendje valóban lényeges: általában S ◦ R és R ◦ S különböző relációkat jelentenek. A definı́cióból azonnal látható egy alapvető tény: ahhoz, hogy az S ◦ R reláció ne legyen üres, szükséges, hogy a B és C halmazoknak legyen közös eleme. Hiszen az (a, b) csak úgy tartozhat R-hez, ha a az A-hoz, b pedig a B-hez tartozik, s hasonlóan, a (b, d) csak úgy tartozhat S-hez, ha b a C-hez, d pedig a D-hez tartozik. Itt tehát kulcsfontosságú, hogy a b elem egyidejűleg B-hez is és C-hez is
tartozzon. Ez azt jelenti, hogy azok a b elemek, amelyekről a definı́cióban szó van, szükségképpen a B ∩ C halmaz elemei; a B halmaznak és a C halmaznak egyéb elemei szóba se jöhetnek, kivéve, persze az üres reláció esetét. Éppen ezért az adott R és S relációk kompozı́ciójának képzésekor eleve feltételezhetjük, hogy B = C, ı́gy a jelölés módosı́tásával a D halmazra már nincs is szükség: feltételezhetjük, hogy R az A × B, S pedig a B × C részhalmaza. Mindamelett természetesen van értelme tetszőleges A, B, C, D esetén is a fenti R és S relációk képzésének, de ez mindig redukálható a B = C esetre. Így célszerű lesz a relációk kompozı́ciójának definı́cióját újrafogalmazni arra az esetre, amikor R ⊆ A × B és S ⊆ B × C adott relációk: ilyenkor tehát S ◦ R mindazon (a, c) rendezett elempárok halmaza az A × C halmazban, melyekhez van olyan
B-beli b elem, melyre (a, b) az R-nek, (b, c) pedig az S-nek eleme. Ebben a szituációban mi volna tehát az R ◦ S reláció? Mindazon B × Bbeli (u, v) elemek halmaza, melyekhez létezik olyan z eleme a C halmaznak, hogy (u, z) az S-hez, (z, v) pedig az R-hez tartozik. Tehát szükségképpen z az A-nak is eleme kell, hogy legyen, azaz, közös eleme kell, hogy legyen az A és C halmazoknak, amint az a fenti, általánosabb esetben már kiderült. Ez mutatja, hogy az is előfordulhat, hogy S ◦ R nem üres, R ◦ S pedig üres. Valójában valami olyasmiről van szó, hogy a b elem mintegy ”összekapcsolja” az a és d elemeket az első változatban, illetve az a és c elemeket a második változatban. A továbbiakban mindig a második változatnál maradunk, ı́gy az R és S relációk kompozı́ciójánál mindig feltételezzük, hogy R ⊆ A × B, és S ⊆ B × C. tehát az A halmaz bizonyos elemei az R reláció révén
kapcsolatba hozhatók a B halmaz bizonyos elemeivel: ezek pontosan az a elem képei az R relációnál. Képzeljük azt, hogy az R reláció az a elemet ”át tudja szállı́tani” az ő képeibe, a B halmaz bizonyos elemeibe. Ezek közül azokat az elemeket, amelyek hozzátartoznak az S reláció értelmezési tartományához, tehát az S révén kapcsolatba hozhatók a C halmaz bizonyos elemeivel, az S reláció ”tovább tudja szállı́tani” a C halmaz bizonyos elemeibe, egész pontosan az a elem R-nél vett képeinek az S-nél keletkező képeibe. Nos, az S ◦R reláció ezeket a C-beli elemeket kapcsolja az adott a elemhez Természetesen előfordulhat, hogy az a elem képei között egy sincs, amely beletartozna az S reláció értelmezési tartományába, tehát az a elemnek nincs olyan képe R-nél, amit az S ”tovább tudna szállı́tani” C-be; ilyenkor az a elem     3.3  Összetett függvény  91  nem
tartozik hozzá az S ◦ R összetett reláció értelmezési tartományához. Ha az R reláció értelmezési tartományának egyetlen a eleme sem ”szállı́tható tovább” az S relációval, akkor az S ◦ R reláció üres lesz. Természetesen számunkra nem az olyan esetek lesznek érdekesek, amikor két reláció kompozı́ciója üres, de tudomásul kell vennünk, hogy ez a lehetőség fennáll. Az értelmezések folytán azonnal látható, hogy ha A0 az A egy részhalmaza, ¡ ¢ akkor S ◦ R(A0 ) = S R(A0 ) teljesül. Különösen fontos az az eset, amikor R és S egyaránt függvények, tehát R : A  B és S : B  C. Ekkor könnyen látható, hogy S ◦ R is függvény Valóban, ha a az A tetszőleges eleme, akkor R(a) pontosan egy elemet tartalmaz, s ı́gy S ◦ R(a) is. Ilyenkor tehát az S ◦ R függvény értékeit úgy kapjuk, hogy az ¡ ¢ R függvény értékeit ”behelyettesı́tjük” az S
függvénybe: S ◦ R(a) = S R(a) . Ebből ered az a szóhasználat, hogy az S ◦ R összetett függvény esetében az R-t, belső függvénynek, S-t pedig külső függvénynek szokás nevezni. Értelemszerűen használhatjuk a belső reláció, illetve külső reláció kefejezéseket is. 3.31 Tétel Legyenek R ⊆ A × B, S ⊆ B × C és T ⊆ C × D relációk Ekkor (i) T ◦ (S ◦ R) = (T ◦ S) ◦ R , (ii) (S ◦ R)−1 = R−1 ◦ S −1 . Bizonyı́tás. Mindhárom állı́tásban halmazok egyenlőségét kell igazolnunk, amelyet a szokott módon végezhetünk el: meg kell mutatnunk, hogy az adott egyenlőség két oldalán álló halmazok kölcsönösen részhalmazai egymásnak. Az első állı́tásnál legyen M = T ◦(S ◦R) és N = (T ◦S)◦R. Legyen először x az M halmaz egy tetszőleges eleme. Mivel az M halmaz az értelmezések folytán az A × D halmaz részhalmaza, ı́gy célszerű lesz az x
= (a, d) jelölés használata, ahol a az A, d pedig a D halmaz eleme. Ha tehát az (a, d) pár hozzátartozik a T és S ◦ R relációk kompozı́ciójához, akkor van olyan c eleme a C halmaznak, hogy (a, c) az S ◦R halmazhoz, (c, d) pedig a T halmazhoz tartozik. Ugyanakkor (a, c) akkor tartozik az S ◦ R halmazhoz, ha van a B halmazban olyan b elem, melynél (a, b) az R-nek, (b, c) pedig az S-nek eleme. Azt kaptuk tehát, hogy az a, b, c, d elemekre a következők teljesülnek: (a, b) ∈ R ,  (b, c) ∈ S ,  (c, d) ∈ T .  A második két összefüggés alapján tehát (b, d) a T ◦ S-nek eleme, s az elsőt is figyelembe véve kapjuk, hogy x = (a, d) az N = (T ◦ S) ◦ R halmazhoz tartozik, tehát M ⊆ N , s az első állı́tás első részét bebizonyı́tottuk. A másik rész bizonyı́tása ugyanı́gy történik, s azt az Olvasóra bı́zzuk. A második állı́tás igazolásához legyen M = (S ◦ R)−1 és N = R−1 ◦ S
−1 , továbbá jelölje x az M halmaz egy tetszőleges elemét. Ismét vegyük észre, hogy itt az x = (c, a) jelölést alkalmazhatjuk, ahol a az A-nak, c a C-nek eleme, hiszen az S ◦R reláció az A×C halmaz részhalmaza, ı́gy M a C ×A részhalmaza. Ekkor     92  A függvénytan elemei  (a, c) az S ◦ R halmaz egy eleme, létezik tehát olyan b a B-ben, hogy (a, b) az R relációnak, (b, c) pedig az S relációnak eleme. Ezt úgy is mondhatjuk, hogy (b, a) az R−1 relációnak, (c, b) pedig az S −1 relációnak eleme, ami azt jelenti, hogy x = (c, a) az N = R−1 ◦ S −1 halmazhoz tartozik, vagyis M ⊆ N . A fordı́tott tartalmazás hasonló bizonyı́tását ezúttal is az Olvasóra bı́zzuk.  Az első tulajdonság azt fejezi ki, hogy a relációk kompozı́ciója asszociatı́v, vagyis egy több tényezőből képzett összetett reláció esetében a kompozı́ció nem függ a tényezők esetleges
csoportosı́tásától. Másszóval, (T ◦ S) ◦ R helyett ı́rhatunk T ◦ S ◦ R-t, ez nem okozhat félreértést. Megjegyezzük, hogy a kommutativitás, vagyis a tényezők felcserélhetősége a kompozı́cióra általában nem igaz, amint azt már fentebb jeleztük. Felvetődhet a kérdés, hogy vajon adott f : A  B függvény esetén mi a jelentése az f −1 ◦ f , illetve az f ◦ f −1 relációknak. Az f −1 ◦ f reláció olyan A × A-beli (u, v) párokból áll, melyekhez létezik a B-nek olyan b eleme, melyre (u, b) az f -hez, ¡(b, v) pedig az f −1¡-hez tartozik. Mivel az A halmaz tetszőleges ¢ ¢ a eleme esetén a, f (a) az f -hez, f (a), a pedig f −1 -hez tartozik, ı́gy (a, a) az f −1 ◦ f -nek eleme, vagyis idA részhalmaza f −1 ◦ f -nek: idA ⊆ f −1 ◦ f . Másrészt, ha (u, v) az f ◦ f −1 egy eleme, akkor van olyan A-beli a, hogy (u, a) az f −1 -nek, (a, v) pedig az f -nek eleme. Így (a, v)
és (a, u) egyidejűleg f -hez tartozik, ami csak úgy lehet, hogy u = v, hiszen f függvény. Így (u, v) = (u, u) az idB -nek eleme, vagyis f ◦ f −1 ⊆ idB . Megjegyezzük, hogy ezekben a tartalmazásokban általában nem áll fenn egyenlőség, kivéve ha f bijektı́v.  3.4  Számosságok  A fentiekben valahányszor olyan helyzet adódott, hogy a ”véges”, illetve ”végtelen” kifejezések használatát nehéz volt elkerülni, mindannyiszor igyekeztünk megfelelő visszafogottságot, óvatosságot tanúsı́tani. Vajon minek köszönhető ez a tartózkodó körülményeskedés ezen szavak használatával kapcsolatban? Nos, ebben a pontban röviden összefoglaljuk azokat a legfontosabb problémákat és lehetséges megoldásuk módszereit, amelyek a ”végtelen” fogalmával kapcsolatosak. A véges és a végtelen számos gondolkodónak megmozgatta a fantáziáját, akik közül többen megkı́séreltek
valamilyen elfogadható definı́ciót adni ezekre a misztikusnak tűnő fogalmakra. A matematikában a ”végtelen”  amint látni     3.4 Számosságok  93  fogjuk  semmivel sem misztikusabb, mint bármely más fogalom: egészen pontosan definiálható. Ugyanakkor az ismertetendő definı́ció megértéséhez célszerű egy kicsit távolabbról indulni. Először is a ”véges” és a ”végtelen” halmazoknak egy-egy tulajdonsága, s ezek a tulajdonságok egymás komplementerei: ha megmondjuk, mit értünk az alatt, hogy egy halmaz véges, akkor egyben a végtelen halmazok fogalmát is definiáltuk, hiszen azok pontosan a nem véges halmazok. Természetesen ez fordı́tva is ı́gy van Semmire sem megyünk olyan tartalmatlan kijelentésekkel, hogy ”egy halmazt akkor nevezünk végtelennek, ha elemeinek száma nem véges”, stb Nyilvánvalóan egy halmaz véges vagy végtelen volta valamilyen értelemben a halmaz elemeinek
számával van összefüggésben, ám az ”elemek száma” fogalom semmivel sem egyszerűbb, és pillanatnyilag ugyanúgy nincs definiálva, mint a ”véges halmaz” fogalma. Történetileg a halmazok elemszámának, számosságának fogalma hosszú fejlődés során alakult ki, valószı́nűleg abból az igényből fakadóan, hogy a különböző halmazokat ”nagyság szerint” valahogyan össze tudjuk hasonlı́tani. Tulajdonképpen arra gondolhatunk, hogy minden halmazhoz hozzárendelünk egy természetes számot, amely az elemeinek számát, a halmaz számosságát hivatott kifejezni. Az üres halmazhoz a 0-t, az egyelemű halmazokhoz az 1-et, a kételemű halmazokhoz Igen, itt megáll a tudomány. Mi az, hogy ”kételemű” halmaz? Hát, amelyiknek két eleme van  vágná rá valaki. Ennek persze semmi értelme nincs Ugyanis odáig rendben van a dolog, hogy az üres halmazhoz a 0 számot rendeljük hozzá,
hiszen, mint láttuk, üres halmaz csak egy van. Az egyelemű halmaz értelmezése sem okoz problémát: az A halmaz akkor egyelemű, ha nem üres, és bármely x, y elemeire igaz, hogy x = y. A kételemű, háromelemű, stb halmazok értelmezése azonban rendkı́vül nehézkes lenne ezen a módon. Ezek szerint nagyjából ott tartunk, ahol az ősember: nulla, egy, sok. Más utat is választhatunk a halmazok ”számosságának” értelmezéséhez, mégpedig azt a módszert, hogy rögzı́tünk bizonyos ”etalon” halmazokat, amelyek az összes lehetséges ”számosságot” reprezentálják, s minden halmazt valahogyan ezekhez hasonlı́tunk. Ez hasonló ahhoz az eljáráshoz, amelyet a különböző fizikai mértékegységek esetében alkalmaztak Például a hosszúság egysége, a méter, melynek ”etalonja” egy, platinának és iridiumnak 9 : 1 arányú ötvözetéből készı́tett rúd, melyet a Bureau
International des Poids et Mesures nevű intézményben, Sèvres-ben, Franciaországban őriznek. Az számı́t 1 méter hosszúnak, ami ugyanolyan hosszú, mint ez a rúd: ezzel összemérve mindkét végén összepasszolnak. Mármost az a kérdés, hogy hogyan lehet halmazok közül ilyen ”etalonokat” kiválasztani, s hogyan lehet azokat más halmazokkal összehasonlı́tani? Nos, az összehasonlı́táshoz van egy kiváló eszközünk: a bijektı́v függvény. Legyenek adottak az A és B halmazok Akkor mondjuk, hogy az A halmaz egyenlő számosságú a B halmazzal, ha van olyan bijektı́v függvény, mely A-t B-re képezi, tehát értelmezési tartománya A, értékkészlete pedig B. Úgy is mondhatjuk ezt, hogy A-t bijektı́v módon B-re lehet képezni. Figyelem: B-re, nem pedig B-be! Lényeges, hogy az értékkészlet a teljes B halmaz. Ennek az alapvető fontosságú fogalomnak néhány egyszerű
tulajdonságát azonnal megállapı́thatjuk Világos, hogy minden halmaz egyenlő számosságú saját     94  A függvénytan elemei  magával, hiszen az A halmazt az idA identikus leképezés bijektı́v módon képezi saját magára. Továbbá, ha A egyenlő számosságú B-vel, akkor B is egyenlő számosságú A-val, hiszen az A-t B-re képező bijektı́v függvény inverze a B-t A-ra képező bijektı́v függvény. Ezért ahelyett, hogy ”A egyenlő számosságú Bvel” nyugodtan mondhatjuk azt, hogy ”A és B egyenlő számosságúak” Végül, ha A egyenlő számosságú B-vel és B egyenlő számosságú C-vel, akkor A egyenlő számosságú C-vel. Valóban, az A-t B-re képező és a B-t C-re képező bijektı́v függvények kompozı́ciója A-t C-re képező bijektı́v függvény. Ezzel végeredményben elértük azt, hogy az összes szóbajövő halmazokat össze tudjuk
hasonlı́tani abban az értelemben, hogy közülük melyeket tekintünk ”egyforma számosságúnak”, másszóval ekvivalensnek, s melyeket nem. Innen már csak egy lépés a nagyság szerinti összehasonlı́tás: akkor mondjuk, hogy az A halmaz kisebb, vagy egyenlő számosságú, mint a B halmaz, ha A egyenlő számosságú a B valamely részhalmazával. Nem nehéz megmutatni, hogy ez a feltétel azzal egyenértékű, hogy a B halmaznak van az A halmazra való szürjektı́v leképezése. Végül akkor mondjuk, hogy az A halmaz kisebb számosságú, mint a B halmaz, ha A kisebb, vagy egyenlő számosságú, mint a B, de nem egyenlő számosságúak. Ez tehát azt jelenti, hogy a B halmaz szürjektı́v módon az A halmazra képezhető, de bijektı́v módon nem. Természetesen ezek után van értelme az ilyen kifejezéseknek, hogy ”az A halmaz nagyobb, vagy egyenlő számosságú, mint a B halmaz”, illetve ”az A
halmaz nagyobb számosságú, mint a B halmaz”. Vegyük észre, hogy a ”számosság” fogalmát nem definiáltuk, csak a ”számosságok nagyság szerinti összehasonlı́tását”. Kiderül, hogy céljainknak ez pont megfelel, hiszen ez már elég ahhoz, hogy a végtelen halmazok fogalmát értelmezzük. Előbb azonban vizsgáljuk meg az iménti definı́ciók néhány érdekes, esetenként talán meglepő következményét. Úgy gondolja az ember, hogy ha egy halmazból akár csak egyetlen elemet is elhagyunk, akkor a visszamaradó halmaz számossága kisebb lesz, mint az eredeti halmaz számossága. Ám ez nem ı́gy van: az f (n) = n + 1 függvény a természetes számok halmazát nyilván bijektı́v módon képezi a pozitı́v egész számok halmazára. Tehát a {0, 1, 2, 3,    } halmaz és az {1, 2, 3,    } halmaz egyenlő számosságúak! Annak ellenére, hogy az utóbbi valódi részhalmaza az
előbbinek! Hasonlóan, az f (n) = 2n függvény a természetes számok halmazát nyilván bijektı́v módon képezi a páros természetes számok halmazára, ı́gy ”számosság értelemben” ugyanannyi természetes szám van, mint ahány páros természetes szám, holott látszólag az előbbiek ”kétszerannyian” vannak, hiszen csupán minden második természetes szám páros. Ezen a ponton az ember hajlamos kissé elbizonytalanodni: biztos, hogy jó ez a definı́ció? Tényleg jó az nekünk, ha egy halmazból elemeket elhagyva a viszszamaradó rész még mindig ”ugyanakkora”? Lehet, hogy ez most még kissé nehezen emészthető meg, de gondoljunk a következőre: egy hosszabb szakasznak több pontja van, mint egy rövidebbnek? A ”hosszúság” az egy dolog, de az     3.4 Számosságok  95  ”elemszám”, a ”számosság” nem ezt akarja kifejezni. Jó, jó, de az mégis nyugtalanı́tó, hogy mi van
akkor, ha az általunk pillanatnyilag még nem definiált, de azért valamit mégiscsak jelentő ”véges” halmazok körében is előfordul ez a skandalum? Ha kiderül, hogy például egy 765 elemű halmaz és egy 766 elemű halmaz egyenlő számosságúak? Nos, ez nem fordulhat elő. Pontosabban a véges halmaz fogalmát éppen az a tulajdonság definiálja, az különbözteti meg a végtelen halmaz fogalmától, hogy az utóbbi egyenlő számosságú tud lenni valamely valódi részhalmazával, mı́g az előbbieknél ez nem fordulhat elő. A pontos definı́ció következik: akkor mondjuk, hogy az A halmaz végtelen halmaz, vagy röviden végtelen, ha egyenlő számosságú valamely valódi részhalmazával. Ez azt jelenti, hogy bijektı́v módon leképezhető saját magának egy valódi, látszólag ”kisebb” részhalmazára. Természetesen akkor mondjuk, hogy az A halmaz véges, ha nem végtelen. Ezek
szerint, a fentebb emlı́tett példák alapján a természetes számok halmaza, a pozitı́v egész számok halmaza és a páros természetes számok halmaza végtelen halmazok. Azért ezt el is vártuk a ”végtelen halmaz” fogalmának bármilyen értelmezésétől. Nyilvánvaló, hogy ezek az újonnan bevezetett fogalmak számos érdekes kérdést vetnek fel. Az egyik ilyen, hogy vajon az általunk eddig ”végesnek” nevezett halmazok, és csak azok, továbbra is végesnek számı́tanak-e? Meg lehet mutatni, hogy ez ı́gy van, persze, attól függően, hogy ”eddig” ki mit tekintett véges, illetve végtelen halmaznak. A következő kérdés az, hogy vajon a mostantól végesnek nevezett halmazok miként hozhatók kapcsolatba a természetes számokkal az ”elemszám” mindeddig nem definiált fogalmán keresztül. Például, mit értünk azon, hogy egy halmaznak 273 eleme van, másszóval, a számossága 273?
Nos, ezen a ponton vissza kell kanyarodnunk az ”etalon”-halmazokhoz. Mit értünk azon, hogy egy halmaznak 0 eleme van, tehát számossága 0? Azt, hogy pontosan ”ugyanannyi” eleme van, mint egy 1nél kevesebb elemet tartalmazó halmaznak, másszóval, ugyanolyan számosságú, mint az üres halmaz. Tehát az üres halmaz ”etalon” szerepet játszik: azok a halmazok számı́tanak 0 számosságúnak, amelyek ”ugyanakkorák”, mint az üres halmaz, másszóval, amelyek bijektı́v módon leképezhetők az üres halmazra. Mit értünk azon, hogy egy halmaznak 1 eleme van, tehát számossága 1? Azt, hogy ”ugyanannyi” eleme van, mint egy 2-nél kevesebb elemet tartalmazó halmaznak, másszóval, a számossága megegyezik az egyelemű halmaz számosságával. Általában, mit értünk azon, hogy egy halmaznak n eleme van, tehát számossága n, ahol n most egy tetszőleges pozitı́v egész számot jelöl? Azt, hogy
”ugyanannyi” eleme van, mint egy n-nél kevesebb elemet tartalmazó halmaznak, másszóval, a számossága megegyezik a {0, 1, 2, .   , n − 1} halmaz számosságával. Az n természetes szám tehát az n-nél kevesebb elemet tartalmazó halmazok számosságát jelöli. Bár a számosságot eddig még nem definiáltuk, de mondhatnánk azt, hogy a véges számosságok nem mások, mint a természetes számok, abban az értelemben, hogy akkor mondjuk, hogy egy halmaz számossága az n természetes szám, ha ennek a halmaznak ugyanakkora a számossága, mint az n-nél kisebb természetes számok halmazának. Ezzel a véges halmazok el is vannak intézve, ebben a körben az ”etalonokat”     96  A függvénytan elemei  a természetes számok jelképezik, de a számosságokkal kapcsolatos fogalmak értelmezése révén a végtelen halmazok közt is ”etalonokat” lehet bevezetni, s azok között nagyságrendi
összehasonlı́tást lehet tenni. Eddig ugyan azt láttuk, hogy a példaként felsorolt végtelen halmazok, a természetes számok, a pozitı́v egész számok, vagy a páros természetes számok halmaza egyaránt ugyanakkora számosságú. Az ilyen halmazok számosságára is van egy egyezményes név és jelölés: a természetes számok halmazával egyenlő számosságú halmazokat megszámlálhatóan végtelennek nevezzük, s az ilyen halmazok számosságának jelölésére a héber ábécé első betűjét, az ℵ0 -t használjuk, melyet ”alef nulla”, vagy ”alef zéró” módon ejtünk. A természetes számok halmaza tehát egy ”etalont” képvisel. Meg lehet mutatni, hogy bármely végtelen halmaznak van megszámlálhatóan végtelen számosságú, azaz, a természetes számok halmazával egyenlő számosságú részhalmaza. Figyelembe véve a számosságok nagyság szerinti
összehasonlı́tásáról mondottakat ez azt jelenti, hogy ℵ0 a legkisebb végtelen számosság. Ha egyáltalán van nem megszámlálhatóan végtelen számosság, akkor az nagyobb, mint a természetes számok halmazának számossága Vajon vane ilyen számosság? Az is előfordulhat ugyanis, hogy bármely két végtelen halmaz között van bijektı́v megfeleltetés, s akkor az egész eddigi okfejtés csak arra volt jó, hogy a véges és a végtelen halmazokat megkülönböztessük egymástól, továbbá a véges halmazok között elméletileg is megalapozzuk a tapasztalatilag érzékelt nagyságrendi hierarchiát. Már ez sem kevés, de a számosság-fogalom ennél többet tud. Érvényes ugyanis a következő tétel 3.41 Tétel Minden halmaz kisebb számosságú, mint hatványhalmaza Bizonyı́tás. Először is értsük meg pontosan, hogy ez a tétel mit állı́t Legyen A egy halmaz, melynek
hatványhalmaza az A összes részhalmazaiból álló halmaz; ezt a fentiekben a P(A) szimbólummal jelöltük. Próbáljuk ki a tétel állı́tásának érvényességét néhány egyszerű esetben. Ha például A = ∅, az üres halmaz, akkor P(A) = {∅}, tehát az üres halmaz hatványhalmaza az a halmaz, amelynek egyetlen eleme az üres halmaz. Az üres halmaz számossága 0, mı́g az egyelemű halmaz számossága 1, ı́gy ebben az esetben az állı́tás működni látszik. A középiskolai ismereteink alapján a tétel állı́tásának érvényességét bármely véges halmazon kipróbálhatjuk. Valóban, ha az A halmaznak n eleme van, ahol n természetes szám, akkor hatványhalmazának éppen 2n eleme lesz, vagyis egy n elemű halmaznak pontosan 2n darab részhalmaza van, ami egyszerű kombinatorikai okoskodással belátható és teljes indukcióval bebizonyı́tható. Ugyanakkor világos, hogy ilyenkor
mindig n < 2n teljesül, tehát az állı́tás véges halmazokra rendben van. Ám végtelen halmazok esetében nem folyamodhatunk ilyen egyszerű összeszámolási módszerhez. Legyen A tetszőleges halmaz Az az állı́tás, hogy A számossága kisebb, mint P(A) számossága két dolgot jelent: egyrészt A számossága kisebb, vagy egyenlő, mint P(A) számossága, vagyis A bijektı́v módon képezhető a P(A) egy részhalmazára, másrészt A számossága nem egyenlő P(A) számosságával, vagyis A-t nem lehet bijektı́v módon a P(A) halmazra képezni. Az első rész bizonyı́tása nagyon egyszerű: világos, hogy az A halmaz elemei és a P(A) halmaz egyelemű részhalmazai között bijektı́v megfeleltetés áll fenn: az A minden elemének feleltessük meg az A-nak azt a     3.4 Számosságok  97  részhalmazát, amely csupán ezt a kiválasztott elemet tartalmazza. Ez nyilván bijektı́v megfeleltetés,
tehát A számossága kisebb, vagy egyenlő, mint P(A) számossága. A második állı́tás bizonyı́tása kevésbé egyszerű. Azt fogjuk megmutatni, hogy A-t már szürjektı́v módon se lehet leképezni a P(A) halmazra. Mivel minden bijektı́v függvény szürjektı́v, ezért ekkor nyilván bijektı́v módon se végezhető el ugyanez, tehát A nem lehet egyenlő számosságú P(A)-val, csak az a lehetőség marad, hogy A kisebb számosságú, mint P(A). A bizonyı́tást indirekt módon végezzük el, vagyis feltételezzük, hogy létezik egy olyan f : A  P(A) függvény, amelynek értékkészlete az egész P(A), vagyis az A halmaz minden eleméhez hozzá lehet rendelni az A halmaz egy részhalmazát úgy, hogy az ilyen módon ”hozzárendelt” részhalmazok kimerı́tsék az A összes részhalmazait. Feltételezésünk alapján az A halmaz összes elemeit két csoportba sorolhatjuk: vannak olyan a elemek,
amelyek beletartoznak a hozzájuk rendelt halmazba, vagyis a ∈ f (a) teljesül, s vannak olyanok, amelyekre ez nem áll fenn, azaz a∈ / f (a). Foglalkozzunk most az utóbbiakkal, s jelöljük az összes ilyen elemek halmazát N -el. Az N halmazba tehát az A összes olyan a elemei tartoznak, amelyek nem elemei a saját képüknek: rájuk a ∈ / f (a) teljesül. Ez az N halmaz az A halmaznak egy részhalmaza, tehát a P(A) halmaznak egy eleme, s mivel feltételezésünk szerint az f függvény szürjektı́v, ez az N halmaz is szerepel az f függvény értékei között. Másszóval, van az A halmaznak legalább egy olyan a0 eleme, hogy f (a0 ) = N . Vizsgáljuk meg, hogy ez az a0 elem vajon az N halmazhoz tartozik, vagy nem Ha a0 az N halmazhoz tartozik, azaz nem eleme a saját képének, ami N , akkor a0 nem tartozik az N halmazhoz. Az aláhúzott állı́tás mutatja, hogy ez az eset nem fordulhat elő. Ezek szerint a0 nem tartozik az N
halmazhoz Ám ha a0 nem tartozik az N halmazhoz, azaz eleme a saját képének, ami N , akkor a0 az N halmazhoz tartozik, hiszen az N halmaz az A-nak éppen azon elemeit tartalmazza, amelyek a saját képükhöz tartoznak. Ismét egybeolvasva az aláhúzott részeket látjuk, hogy ez az eset sem lehetséges: az a0 tehát az A halmaznak olyan eleme, amely sem az N halmazhoz, sem az AN halmazhoz nem tartozhat, ami ellentmondás, hiszen az A halmaz minden eleme ezek valamelyikéhez tartozik. A kapott ellentmondás a tétel állı́tását igazolja. Ez a rendkı́vül nagy jelentőségű tétel azt mutatja, hogy a számosságok összehasonlı́tásának ilyen formában bevezetett módja nem csak arra alkalmas, hogy világos különbséget tudjunk tenni véges és végtelen halmazok között, nem csupán arra használható hogy össze tudjuk hasonlı́tani nagyság szerint a különböző véges számosságokat, hanem még a
végtelen halmazok között is képes ”nagysági alapon” különbséget tenni. Konkrét alkalmazásként a következő tételt mutatjuk be 3.42 Tétel A valós számok halmaza nem megszámlálható Bizonyı́tás. Elegendő azt igazolni, hogy a [0, 1] intervallum számossága nagyobb, mint N számossága. A [0, 1] intervallum nagyobb, vagy egyenlő számosságú,     98  A függvénytan elemei  mint a természetes számok halmaza. Valóban, az utóbbi egyenlő számosságú a pozitı́v egész számok halmazával, amely viszont a g(n) = n1 bijektı́v megfeleltetés révén azonos számosságú a [0, 1] intervallum egy részhalmazával. Így elegendő azt bebizonyı́tani, hogy nem létezik f : N  [0, 1] szürjektı́v leképezés Tegyük fel, hogy létezik ilyen f . Legyen a0 = 0, és b0 = 1/3, ha f (0) nem tartozik a [0, 1/3] intervallumhoz, egyébként pedig a0 = 2/3 és b0 = 1 Válasszuk például az első
esetet. Ha f (1) nem tartozik a [0, 1/9] intervallumhoz, akkor [a1 , b1 ] legyen ez az intervallum, egyébként pedig [2/9, 1/3]. Az eljárást folytatva, ha az [an , bn ] intervallumot már meghatároztuk, akkor f (n + 1) az # " " # bn − an bn − an , bn an , an + és bn − 3 3 intervallumok közül legalább az egyiknek nem eleme. Ezt az intervallumot, vagy ezek közül a baloldalit jelöljük [an+1 , bn+1 ]-el. Az ı́gy kapott [an , bn ] intervallumok intervallumskatulyázást alkotnak, melyről a valós számok halmazának teljessége alapján tudjuk, hogy az összes intervallumoknak van közös pontja, melyet jelöljön α. A konstrukció alapján világos, hogy ez az α nincs benne f értékkészletében, s ez ellentmond annak, hogy f szürjektı́v. A valós számok halmaza tehát határozottan nagyobb számosságú, mint a természetes számok halmaza. Megjegyezzük, hogy a racionális számok halmazáról is
könnyen kimutatható, hogy megszámlálhatóan végtelen, ı́gy a valós számok halmaza számossági szempontból új minőséget képvisel, újabb ”etalon”. A valós számok halmazával egyenlő számosságú halmazokat kontinuum számosságú halmazoknak nevezzük. Például, nem nehéz megmutatni, hogy az irracionális számok halmaza és a komplex számok halmaza egyaránt kontinuum számosságú, azaz, a valós számok halmazával megegyező számosságú. Az eddig megismert halmazaink számosságaik nagysága szerint úgy rendezhetők sorba, hogy a legkisebb számosság az üres halmaz számossága, ezt követik a természetes számok növekvő sorrendjének megfelelően a véges halmazok számosságai, majd következik az első nem véges számosság: a megszámlálhatóan végtelen, amely minden véges számosságnál nagyobb, s amely például a természetes számok, az egész számok
és a racionális számok számossága. A valós számok úgynevezett kontinuum számossága ennél is nagyobb. Ha még nagyobb számosságokat akarunk mondani, akkor a 3.41 tétel alapján a kontinuum számosságnál nagyobb a valós számok halmaza összes részhalmazaiból álló halmaz számossága. Néhány kérdés azonban továbbra is nyitva marad Arra már utaltunk, hogy a természetes számok számosságánál, tehát a megszámlálhatóan végtelen számosságnál nincs kisebb végtelen számosság. Ám azt nem tudjuk, hogy a megszámlálhatóan végtelen és a kontinuum között van-e valamilyen számosság? Azt meg lehet mutatni, hogy a kontinuum számosság valójában ugyanaz, mint a természetes számok összes részhalmazai halmazának számossága, de azt nem tudjuk, hogy e kettő között van-e valami ezektől különböző számosság? A véges halmazok körében ugyanis láttuk,
hogy az n     Valós függvények  99  elemű halmazról az összes részhalmazok halmazára áttérni az n-ről 2n -re való átlépést jelenti, ami túl nagy ugrás, hiszen vannak olyan halmazok, amelyek számossága n és 2n között van. A végtelen halmazok körében viszont sajnos nem ismeretes olyan módszer, amellyel egy adott halmaz számosságánál nagyobb, de hatványhalmazának számosságánál kisebb számosságú halmazt lehetne gyártani. Esetleg az volna jó, ha ilyen módszer nem is létezne, tehát a végtelen halmazok körében számosság értelemben a legkisebb ”lépés” az lenne, hogy vesszük a hatványhalmaz számosságát. Tehát, például a természetes számok halmaza esetében ez azt jelentené, hogy a megszámlálhatónál nagyobb legkisebb számosság a kontinuum volna. Ez az úgynevezett kontinuum-hipotézis, melyet senkinek sem cáfolni, sem bizonyı́tani nem sikerült, a
legkiválóbb matematikusok minden erőfeszı́tése ellenére. Végül 1962-ben P Cohen7 , amerikai matematikus bebizonyı́totta, hogy a kontinuum-hipotézist a halmazelmélet szokásos axiómarendszerének keretein belül sem cáfolni, sem bizonyı́tani nem lehetséges: ez az állı́tás független a többi axiómától, azokból sem az állı́tás, sem annak tagadása nem vezethető le. Ugyanaz a helyzet állt tehát elő, mint Bolyai János több, mint száz évvel korábbi, minden idők egyik legjelentősebb matematikai felfedezése esetében, amikor kimutatta, hogy az úgynevezett párhuzamossági axióma a geometria akkoriban szokásos keretei között sem nem cáfolható, sem nem bizonyı́tható: a többi axiómától logikailag független. Ez a kontinuumhipotézissel kapcsolatos szı́vbemarkoló eredmény ugyanakkor természetesen a matematika korlátaira is rávilágı́tott: bár korábban az axiomatikus
módszert mindenhatónak tartották, kiderült, hogy vannak olyan egészen egyszerűen megfogalmazható matematikai ı́téletek, melyeknek igazságtartalma az adott axiómarendszer keretein belül meghatározhatatlan. Később azt is kimutatták, hogy ez minden valamirevaló axiómarendszerrel kapcsolatban ı́gy van: spirituális világunk nem szorı́tható néhány, akárhány axióma által megszabott határok közé. És ez valószı́nűleg ı́gy van jól  3.5  Valós függvények  A gyakorlati alkalmazásokban a fenti, meglehetősen absztrakt függvényfogalomnak általában csupán nagyon speciális eseteivel találkozunk. A számunkra leggyakoribb eset az lesz, amikor a szóbanforgó függvények értelmezési tartománya és értékkészlete egyaránt a valós számok egy részhalmaza. Az ilyen függvényeket valós függvényeknek fogjuk nevezni. Ha tehát f egy valós függvény, akkor van a valós
számok halmazának olyan D részhalmaza, hogy f : D  R, ahol tehát D az f értelmezési tartománya, melyet néha Df módon is jelölünk; az angol ”domain” szó kezdőbetűje erre utal. Az f értékkészletét, amely tehát ugyancsak a valós számok halmazának egy részhalmaza, szokás Rf -el jelölni, ahol az angol ”range” szó kezdőbetűje utal a jelentésre. Tehát az értelmezési tartomány elvileg a valós számok halmazának tetszőleges részhalmaza lehet, ám a gyakorlatban leginkább olyan függvények lépnek fel, melyek értelmezési 7 Paul Cohen (1934- ), amerikai matematikus     100  A függvénytan elemei  tartománya a valós számok valamely részintervalluma, illetőleg diszjunkt részintervallumok egyesı́tése. Ezek a részintervallumok lehetnek nyı́ltak, zártak, félig nyı́ltak, végesek, félig végtelenek, illetve az értelmezési intervallum lehet maga az egész R is. Ez
természetesen nem zárja ki annak a lehetőségét, hogy esetenként olyan függvények is felbukkanjanak, amelyek értelmezési tartománya nem tartozik az emlı́tett tı́pusokba. Például fontos szerepet játszanak az olyan függvények, amelyek értelmezési tartománya a természtes számok halmaza, vagy annak egy végtelen részintervalluma. Az ilyen függvényeket valós számsorozatoknak nevezzük, melyekkel a későbbi tanulmányok során fogunk részletesen foglalkozni. Valós függvények megadására számos módszer ismeretes. A definı́ció szerint egy valós függvény akkor adott, ha meg van adva a rendezett valós számpárok R × R halmazának egy részhalmaza, amit mondjuk f jelöl, de úgy, hogy ha (a, b) és (a, c) az f -hez tartozik, akkor b = c. Ennek a ténynek a jelölésére használjuk az f : A  R jelölést, továbbá ha (a, b) az f -hez tartozik, akkor b helyett inkább f (a)-t ı́runk. A
függvényt tehát akkor ismerjük, ha ismerjük az A ⊆ R halmazt, valamint az A halmaz minden a eleme esetén az f (a) elemet, vagyis a ”hozzárendelési szabályt”, amely megmondja, hogy az A értelmezési tartomány a eleme melyik  egyértelműen ¡ ¢ meghatározott  R-beli f (a) valós számmal együtt tartozik az f -hez a, f (a) ∈ f értelemben. Mint már korábban jeleztük, ez az f (a) szám az f függvény a pontban felvett értéke, az a ponthoz tartozó függvényérték. Jegyezzük meg tehát, hogy ha adott egy f valós függvény, akkor nincs értelme azt kérdezni, hogy ”mi az f értelmezési tartománya?”, hiszen amı́g ezt nem tudjuk, addig azt se tudjuk, hogy mi az f függvény. Hasonlóan értelmetlen egy ilyen feladat, hogy ”Határozzuk meg a következő függvény értelmezési tartományát!”, hiszen a ”következő függvény” megadása szükségképpen együtt kell, hogy járjon
értelmezési tartományának, értékkészletének, stb. megadásával Azonban mégis tudunk értelmet tulajdonı́tani az ilyen tı́pusú kérdéseknek, feladatoknak a következő megállapodással Egy valós függvény megadásának az egyik legelterjedtebb módja az, hogy felı́runk egy ”képletet”, azaz, egy algebrai formulát, amit úgy kell értenünk, hogy minden olyan valós számhoz, amit a képletbe egyáltalán van értelme behelyettesı́teni, a függvényünk azt a valós számot rendeli, amit az illető értéknek a képletbe való behelyettesı́tése és kiértékelése után kapunk. Az ilyen módon ”értelmezett” függvények esetében megállapodunk abban, hogy ha mást nem mondunk, akkor a függvény értelmezési tartománya alatt a valós számok halmazának azt a legbővebb részhalmazát értjük, melynek elemeit egyáltalán van értelme a képletbe behelyettesı́teni.
Például az f (x) = x−1 valós függvény értelmezési tartománya ezen az alapon a nullától különböző valós számok halmaza, hiszen ez az a legbővebb valós számhalmaz, amelyhez tartozó valós számoknak egyáltalán van reciproka. Természetesen a képlet megadása ebben az értelemben az értékkészletet is azonnal meghatározza, hiszen az értékkészlet a valós számok halmazának az a részhalmaza lesz, amelynek számai az értelmezési tartomány elemeinek a képletbe való behelyettesı́tése során kijönnek. Megjegyezzük, hogy egy ilyen, képlettel megadott függvény esetén mind az értelmezési     3.5 Valós függvények  101  tartomány, mind az értékkészlet explicit meghatározása súlyos, esetenként megoldhatatlan nehézségeket okozhat. A valós függvények egyik lehetséges megadási módja tehát valamilyen algebrai formulával, képlettel történhet, amelyből a
függvényértékek algebrai műveletek elvégzésével kiszámı́thatók. A fenti megállapodás szerint az ilyen esetekben a függvény értelmezési tartományát  s természetesen értékkészletét is  maga a képlet határozza meg, nem pedig ügyességünk, vagy ügyetlenségünk, vagyis az a képességünk, hogy valamit be tudunk-e helyettesı́teni a képletbe, vagy nem. Egy másik, elég gyakran használt megadási mód a függvény elemeinek felsorolása, vagyis azoknak a rendezett valós számpároknak a taxatı́v megadása, amelyek a függvényhez tartoznak. Ez természetesen csak korlátozott mértékben és kevés esetben lehetséges. Hiszen ha a függvény értelmezési tartománya egy hatalmas halmaz, amelynek áttekinthetetlenül sok eleme van, akkor ez a megadási mód eleve reménytelen. Ilyen megadási módok leginkább olyankor jöhetnek szóba, amikor valamilyen gyakorlati folyamatokkal
kapcsolatban méréseket végzünk, s a mérések eredményeit úgynevezett értéktáblázatokban foglaljuk össze, tehát minden egyes mérési helyhez megadjuk a mért adat értékét. Vagy egy másik példa: egy boltban például nyilván van egy árlista, amelyen minden olyan terméknek, amit a boltban árusı́tanak meg van adva annak az ára. Ez egy tipikus példa az értéktáblázattal, vagy röviden táblázattal való függvénymegadási módra. A táblázatból természetesen azonnal kiolvasható a függvény értelmezési tartománya és értékkészlete. Ezen a helyen szokás megemlı́teni a függvények megadásának egy harmadik módját, az úgynevezett diagrammal való megadást. Ez alatt valami olyasmit kell érteni, hogy a sı́kban rögzı́tünk egy derékszögű koordinátarendszert, melynek vı́zszintes tengelyén, az úgynevezett x-tengelyen kikeressük az értelmezési tartomány
x elemének megfelelő pontot, ami a valós számoknak az egyenes pontjaival való, fentebb tárgyalt azonosı́tása révén lehetséges, majd ebből a pontból kiindulva függőlegesen, az úgynevezett y-tengellyel párhuzamos egyenesen, ami ugyancsak egy számegyes, kikeressük az x értéknek megfelelő ¡ y =¢f (x) függvényértéket. A ”diagram” az ilyen módon kapott (x, y) = x, f (x) koordinátájú sı́kbeli pontok halmaza Ezt a halmazt szokás a függvény gráfjának, vagy grafikonjának, görbéjének nevezni. Vegyük észre, hogy ez a halmaz, mint az R × R halmaz részhalmaza, valójában maga ”a” függvény. Ugyanezt egyébként tetszőleges reláció esetén is elvégezhetjük, s egy függvényt ebben az értelemben az különböztet meg szemléletes módon egy ”nem függvény”-től, hogy grafikonját minden függőleges egyenes legfeljebb egy pontban metszi. Legyenek adottak az A, B
halmazok, s legyen f : A  B egy függvény. Ha D az A halmaz tetszőleges részhalmaza, akkor az f függvény D-re való leszűkı́tését, vagy szűkı́tését az az f |D függvény jelöli, melyet a D halmaz tetszőleges x pontjában az f |D (x) = f (x) egyenlőség értelmez. Tehát az f |D függvény ugyanazokban a pontokban ugyana-     102  A függvénytan elemei  zokat az értékeket veszi fel, mint f , de eltekintünk az f függvény értelmezési tartományának D-n kı́vüli részétől, egyszerűen ”elfelejtjük”, hogy az f a D halmazon kı́vül is értelmezve van. Felvetődik a kérdés, hogy mi az értelme ennek az egésznek? Nos, esetenként előfordulhat, hogy egy függvény egy bizonyos tulajdonsággal nem rendelkezik az egész értelmezési tartományán, hanem annak csak egy részén, ı́gy az illető tulajdonság szempontjából célszerű a függvénynek ”attól a részétől”
eltekinteni, amely az illető tulajdonsággal nem rendelkezik. Ha tehát azt mondjuk, hogy az f függvénynek a g függvény leszűkı́tése, akkor ez azt jelenti, hogy a g függvény értelmezési tartománya részhalmaza az f függvény értelmezési tartományának, s a g függvény értékei a saját értelmezési tartományán megegyeznek az f megfelelő értékeivel. Ilyenkor egyébként azt is szokás mondani, hogy az f függvény a g függvénynek kiterjesztése, vagy bővı́tése.  3.6  Néhány egyszerű függvény  Ebben a szakaszban néhány olyan egyszerű valós függvényről ejtünk szót, amelyek számos esetben felmerülnek az alkalmazásokban, ám használatuk talán nem eléggé elterjedt. Az egyik ilyen függvény a következő módon van értelmezve. Legyen x valós szám, s jelentse [x] az x-nél nem nagyobb egész számok közül a legnagyobbat. Egyszerűen belátható, hogy ilyen
szám minden valós x esetén egyértelműen létezik, melyet az x valós szám egész részének nevezünk. Azt a függvényt, amely minden x valós számhoz az egész részét, tehát [x]-et rendeli hozzá, egészrészfüggvénynek nevezzük. Ez a függvény tehát az x 7 [x] hozzárendelési szabály alapján működik. Értelmezési tartománya tehát a valós számok halmaza Mivel értékei definı́ció szerint egész számok, továbbá minden egész szám egyenlő a saját egész részével, ı́gy értékkészlete az egész számok halmaza. A függvény bármely n egész szám esetén az [n, n + 1[ intervallumon állandó, értéke n. Ugyanakkor ne feledjük, hogy [x] az x-nél nem nagyobb egész számok közül a legnagyobbat jelenti, tehát például [−π] = −4. Javasoljuk az Olvasónak, hogy vizsgálja meg, milyen kapcsolat van tetszőleges x, y valós számok esetén az [x], az [y],
valamint az [x + y] és [x · y] között. A függvény grafikonját az alábbi ábrán láthatjuk. Az egészrész-függvénnyel szoros kapcsolatban van a törtrész-függvény. Az x valós szám törtrészének nevezzük az {x} = x−[x] számot, azt a függvényt pedig, amely minden valós számhoz a törtrészét rendeli, törtrész-függvénynek. Ezt a függvényt tehát az x 7 {x} hozzárendelési szabály adja meg, értelmezési tartománya a valós számok halmaza. Világos, hogy minden valós szám törtrésze a [0, 1[ intervallumba esik, valamint az ebbe az intervallumba eső számok törtrésze maga az illető szám. Ezért tehát a törtrész-függvény értékkészlete a [0, 1[ balról zárt, jobbról nyı́lt intervallum. A fenti példához hasonlóan, vajon mennyi {−3.14}? Ismét javasoljuk az Olvasónak, hogy vizsgálja meg, milyen kapcsolat van tetszőleges x, y valós számok esetén az
{x}, az {y} valamint az {x + y} és {x · y} között. A törtrész-függvény grafikonját ugyancsak alább láthatjuk     3.6 Néhány egyszerű függvény  103  3  2  1  -3  -2  -1  0 0  1  2  3  x -1  -2  -3  1. Ábra: Az egészrész-függvény  -3  -2  -1  1 0.8 0.6 0.4 0.2 0 0  1  2  3  x  2. Ábra: A törtrész-függvény  Megjegyezzük, hogy sajnálatos módon az x valós szám törtrészének {x} jelölése nem túlságosan szerencsés amiatt, hogy ugyanez a szimbólum jelenti azt a halmazt, melynek egyetlen eleme x. Reméljük, hogy a szövegkörnyezetből mindig ki fog derülni, hogy éppen melyik jelentéssel van dolgunk, ı́gy ez a kétértelműség nem fog félreértést okozni. Bármely x valós szám esetén az x abszolút értékét a következő módon értelmezzük: ( x ha x ≥ 0, |x| = −x ha x < 0.     104  A függvénytan elemei  Azt a függvényt, amely minden valós számhoz az
abszolút értékét rendeli, tehát az x 7 |x| hozzárendelést valósı́tja meg, abszolútérték-függvénynek nevezzük. Értelmezési tartománya a valós számok halmaza. Mivel értékei nyilván nem negatı́v valós számok, továbbá minden nem negatı́v valós szám abszolút értéke saját maga, ı́gy a függvény értékkészlete a nem negatı́v valós számok halmaza. Az egyetlen valós szám, amelynek abszolút értéke 0, maga a 0, minden más valós szám abszolút értéke pozitı́v. Az x valós szám abszolút értékét geometriailag úgy realizálhatjuk, mint a számegyenesen az x-nek megfelelő pont origótól mért távolságát. Két valós szám abszolút értéke akkor és csak akkor egyenlő, ha a két szám vagy egyenlő, vagy egymás negatı́vjai. Az abszolútérték-függvény tulajdonságait az alábbi tételben foglaltuk össze. 3.61 Tétel Bármely x, y
valós számok esetén fennállnak a következők: (a) |x| ≥ 0, és |x| = 0 akkor és csak akkor teljesül, ha x = 0; (b) |x · y| = |x| · |y|; ¯ ¯ (c) ¯ |x| − |y|¯ ≤ |x + y| ≤ |x| + |y|. A tétel bizonyı́tása nagyon egyszerű, az Olvasóra bı́zzuk. A harmadik állı́tás második fele az úgynevezett háromszög-egyenlőtlenség, mely azt fejezi ki, hogy egy háromszög bármely két oldala hosszának összege nem kisebb, mint a harmadik oldal hossza. Ez a tulajdonság két összeadandóról tetszőleges véges számú összeadandóra teljes indukcióval terjeszthető ki A függvény grafikonját az alábbi ábrán láthatjuk.  2 1.5 1 0.5 0 -2  -1  0  1  x  3. Ábra: Az abszolútérték-függvény  2     Valós függvények alaki tulajdonságai  105  Végül, bármely x valós szám esetén legyen   ha x > 0, 1 sgn x = 0 ha x = 0,   −1 ha x < 0. A sgn x valós számot az x
valós szám előjelének nevezzük. Az x 7 sgn x az előjelfüggvény.  1  0.5  0 -2  -1  0  1  2  x  -0.5  -1  4. Ábra: Az előjelfüggvény  3.7  Valós függvények alaki tulajdonságai  A valós függvényeknek vannak olyan egyszerű, algebrai eszközökkel megfogalmazható tulajdonságai, amelyek elsősorban a függvény görbéjének, grafikonjának valamilyen geometriai tulajdonságát fejezik ki. Ezek közül az úgynevezett alaki tulajdonságok közül vizsgálunk most meg néhányat A fentiekben emlı́tettük ugyan, hogy a gyakorlati alkalmazásokban és a középiskolában előforduló függvények legtöbbjének az értelmezési tartománya véges, esetleg végtelen sok páronként diszjunkt intervallum egyesı́tése, ám az alábbiakban lehetőség szerint az előforduló függvények értelmezési tartományáról mindössze annyit tételezünk fel, amennyi az illető fogalom
bevezetéséhez éppen szükséges. A következőkben esetenként a ”valós függvény” kifejezés helyett röviden a ”függvény” szót használjuk. Legyen D a valós számok halmazának egy olyan részhalmaza, mely minden x elemével együtt −x-et is tartalmazza. E tulajdonság geometriailag nyilván azt jelenti, hogy a D halmaz az origóra szimmetrikusan helyezkedik el     106  A függvénytan elemei  Éppen ezért az ilyen halmazokat a továbbiakban szimmetrikus halmazoknak fogjuk nevezni. Legyen adott az f : D  R valós függvény Akkor mondjuk, hogy az f függvény páros, ha a D bármely x eleme esetén f (−x) = f (x) teljesül, s akkor mondjuk, hogy az f függvény páratlan, ha a D bármely x eleme esetén f (−x) = −f (x) teljesül. Könnyű látni, hogy páros függvény grafikonja az y-tengelyre, páratlan függvény grafikonja pedig az origóra szimmetrikus. A párosság, páratlanság tehát a
függvény grafikonjának egy bizonyos geometriai szimmetriatulajdonságát fejezi ki. Például az idR függvény nyilván páratlan Valóban, ebben az esetben D = R, s az f = idR függvény az f (x) = x formulával van értelmezve minden valós x esetén. Ekkor tehát f (−x) = −x = −f (x) érvényes, azaz, a függvény páratlan. Ugyanakkor a D = R halmazon a g(x) = x2 formulával értelmezett g függvény páros, hiszen minden valós x esetén fennáll g(−x) = (x−)2 = x2 = g(x). Ugyancsak páros az abszolútérték-függvény, mı́g az előjelfüggvény nyilván páratlan. Ha egy függvény egyidejűleg páros is és páratlan is, akkor azonosan 0, hiszen ekkor az értelmezési tartományából vett minden x esetén f (x) = f (−x) = −f (x) teljesül, ı́gy f (x) = 0. Természetesen vannak olyan függvények, amelyek sem nem párosak, sem nem páratlanok. Viszont, ha egy valós függvény értelmezési
tartománya szimmetrikus, akkor a függvényt mindig elő lehet állı́tani egy páros és egy páratlan függvény összegeként. Valóban, ha az f függvény értelmezési tartománya a szimmetrikus D halmaz, tehát f : D  R, akkor a D halmaz tetszőleges x pontjában f (x) + f (−x) fe (x) = 2 módon értelmezett fe : D  R függvényt az f páros részének, az fo (x) =  f (x) − f (−x) 2  módon értelmezett fo : D  R függvényt pedig az f páratlan részének nevezzük. Itt az ”e”, illetve ”o” indexek az angol ”even”, illetve ”odd” szavak kezdőbetűire utalnak, amelyek a ”páros”, illetve ”páratlan” szavak angol megfelelői. Azonnal ellenőrizhető, hogy fe páros, fo páratlan, valamint f (x) = fe (x)+fo (x) teljesül a D halmaz minden x eleme esetén. Így bizonyos esetekben egy szimmetrikus halmazon értelmezett függvény vizsgálata visszavezethető egy páros és egy páratlan
függvény vizsgálatára, ami hasznos egyszerűsı́téseket eredményezhet. Valós függvények grafikonjának egy másik szimmetriatulajdonságára utal a következő fogalom. Legyen D a valós számok halmazának egy részhalmaza, továbbá legyen p pozitı́v valós szám. Tegyük fel, hogy a D halmaz minden x elemével együtt az x + p számot is tartalmazza. Ha az f : D  R függvény minden D-beli x elem esetén teljesı́ti az f (x + p) = f (x) egyenlőséget, akkor azt mondjuk, hogy az f függvény p szerint periodikus, valamint a p számot az f függvény egy periódusának nevezzük. Ilyenkor fennáll az f (x + k · p) = f (x) egyenlőség a D halmaz bármely x eleme és bármely k természetes szám esetén. Ha az f függvény periódusai között van legkisebb, akkor azt szoktuk nevezni     3.7 Valós függvények alaki tulajdonságai  107  az f periódusának, bár természetesen  az előbbi megjegyzés
szerint  egy periódusnak bármilyen pozitı́v egész számú többszöröse ugyancsak periódus. Ha az f függvény p szerint periodikus és nincs p-nél kisebb periódusa, valamint az [a, a + p [ intervallum az f értelmezési tartományához tartozik, akkor az f grafikonjának azt a részét, amely az [a, a + p [ intervallum elemeihez tartozó függvényértékeket reprezentálja, az f függvény egy periódusának szokás nevezni. Nyilvánvaló, hogy ilyen esetben a függvény grafikonjának geometriai jellegzetességei, s a függvény egyéb tulajdonságai mind egyszerűen kikövetkeztethetők a függvény egy periódusának ismeretéből. Ez a tény a gyakorlatban fellépő függvényvizsgálati problémák esetén lehetővé teszi, hogy egy periodikus függvény tanulmányozását leszűkı́tsük a függvény egy periódusának vizsgálatára. A fentiekben emlı́tett egyszerű függvények közül
például a törtrész-függvény nyilván 1 szerint periodikus, s az 1 egyben legkisebb periódusa. Így erről a függvényről minden lényeges információt megkapunk, ha azt csupán például a [0, 1[ intervallumon vizsgáljuk. Legyen D a valós számok halmazának tetszőleges részhalmaza, f : D  R pedig egy függvény. Akkor mondjuk, hogy f monoton növekvő, ha a D halmaz bármely x, y elemei mellett x ≤ y esetén f (x) ≤ f (y) következik Hasonlóan, akkor mondjuk, hogy f monoton csökkenő, ha a D halmaz bármely x, y elemei mellett x ≤ y esetén f (x) ≥ f (y) következik. Akkor mondjuk, hogy f szigorúan monoton növekvő, ha a D halmaz bármely x, y elemei mellett x < y esetén f (x) < f (y) következik, s akkor mondjuk, hogy f szigorúan monoton csökkenő, ha a D halmaz bármely x, y elemei mellett x < y esetén f (x) > f (y) következik. Ezekből a kifejezésekből a ”monoton” szót
elhagyhatjuk, de a jelentésük változatlan marad Ha f monoton növekvő, vagy monoton csökkenő, akkor monotonnak nevezzük, ha pedig szigorúan monoton növekvő, vagy szigorúan monoton csökkenő, akkor szigorúan monotonnak. A szigorúan monoton függvények nyilván kölcsönösen egyértelműek, ı́gy az inverzük függvény, amelyről könnyű látni, hogy ugyanolyan értelemben szigorúan monoton. Tehát szigorúan növekvő függvény inverze is szigorúan növekvő függvény, szigorúan csökkenő függvény inverze pedig szigorúan növekvő függvény. Az is világos, hogy ha egy f függvény növekvő, vagy szigorúan növekvő, akkor az a −f függvény, melyre (−f )(x) = −f (x) teljesül az értelmezési tartomány minden x pontjában, csökkenő, vagy szigorúan csökkenő, s ez fordı́tva is igaz. Legalább két pontot tartalmazó értelmezési tartományon olyan függvény
nincs, amely egyidejűleg szigorúan növekvő és csökkenő, s azok a függvények amelyek egyidejűleg monoton növekvők és csökkenők pontosan a konstansok. A korábbi példák közül az idR függvény szigorúan monoton növekvő, ı́gy a −idR függvény szigorúan monoton csökkenő. Az egészrész-függvény nyilván növekvő, de a törtrész-függvény és az abszolútérték-függvény nem monoton. Az előjelfüggvény monoton növekvő.     108  A függvénytan elemei  Legyen D a valós számok halmazának tetszőleges részhalmaza és f : D  R egy függvény. Ha van olyan k valós szám, hogy a D halmaz minden x eleme esetén f (x) ≥ k teljesül, akkor azt mondjuk, hogy az f függvény alulról korlátos. Ilyenkor a k számot az f függvény egy alsó korlátjának mondjuk. Hasonlóan, ha van olyan K valós szám, hogy a D halmaz minden x eleme esetén f (x) ≤ K teljesül, akkor azt
mondjuk, hogy az f függvény felülről korlátos, s az ilyen K számot az f függvény egy felső korlátjának nevezzük. Ha egy függvény alulról is és felülről is korlátos, akkor azt mondjuk, hogy korlátos. Az ilyen függvények tehát eleget tesznek egy k ≤ f (x) ≤ K tı́pusú egyenlőtlenségnek az értelmezési tartományuk minden x pontjában. Geometriailag az alulról korlátos függvény grafikonja teljes egészében egy vı́zszintes egyenes felett halad, mı́g a felülről korlátos függvény grafikonja teljes egészében egy vı́zszintes egyenes alatt halad. Egy korlátos függvény grafikonja teljes egészében két vı́zszintes egyenes által határolt sávban marad. Könnyű látni, hogy egy f függvény akkor és csak akkor korlátos, ha van olyan M valós szám, hogy |f (x)| ≤ M teljesül értelmezési tartományának minden x elemére. Egy ilyen M számot szokás az f egy
korlátjának nevezni. Nyilvánvaló, hogy ha k az f egy alsó korlátja, akkor minden k-nál kisebb szám is alsó korlátja f -nek, s hasonlóan, ha K az f egy felső korlátja, akkor minden K-nál nagyobb szám is felső korlátja f -nek. Végül, ha M az f egy korlátja, akkor bármely M -nél nagyobb szám is korlátja f -nek. Világos, hogy ha az f értékkészletének van legkisebb eleme, akkor f alulról korlátos, s ez a legkisebb függvényérték egyben egy alsó korlátja, melyet a függvény minimumának nevezünk, az értelmezési tartománynak azokat a pontjait pedig, amelyekben a függvény ezt az értéket felvesz, a függvény minimumhelyeinek. Hasonlóan értelmezzük egy függvény maximumát és maximumhelyeit. Az f függvény minimumát, illetve maximumát min f , illetve max f jelöli. Felhı́vjuk a figyelmet arra, hogy egy függvénynek nem feltétlenül létezik minimuma, illetve maximuma,
még akkor sem, ha alulról, illetve felülről korlátos. A korábbi példák közül az idR függvény nyilván sem alulról, sem felülről nem korlátos, s ugyanez érvényes az egészrész-függvényre. A törtrész-függvény alulról és felülről korlátos, tehát korlátos, egy alsó korlátja 0, egy felső korlátja 1, s egy korlátja 1. A függvény minimuma 0, minimumhelyei az egész számok, maximuma nincs. Az abszolútérték-függvény alulról korlátos, felülről nem, egy alsó korlátja a 0, mely egyben minimuma. Az egyetlen minimumhelye a 0 Az előjelfüggvény alulról is, felülről is korlátos, tehát korlátos, egy alsó korlátja −1, mely egyben minimuma, egy felső korlátja pedig 1, mely egyben maximuma. Minimumhelyei az összes negatı́v valós számok, maximumhelyei pedig az összes pozitı́v valós számok. A következő fogalmak értelmezéséhez tételezzük fel, hogy I
valós számok halmazának egy részintervalluma, mely lehet nyı́lt, zárt, vagy félig nyı́lt, s lehet végtelen is. Akkor mondjuk, hogy az f : I  R függvény konvex, ha bármely I-beli x, y elemek és bármely 0 ≤ λ ≤ 1 valós szám esetén ¡ ¢ f λx + (1 − λ)y ≤ λf (x) + (1 − λ)f (y)     Hatványfüggvények  109  teljesül. Akkor mondjuk, hogy az f konkáv, ha bármely I-beli x, y elemek és bármely 0 ≤ λ ≤ 1 valós szám esetén ¡ ¢ f λx + (1 − λ)y ≥ λf (x) + (1 − λ)f (y) teljesül. Értelmezhetjük az f függvény szigorúan konvex, illetve szigorúan konkáv tulajdonságát is úgy, hogy a fentiekben az x, y különböző elemei az I-nek, a λ szám a 0 < λ < 1 egyenlőtlenséget teljesı́ti, s a felı́rt két egyenlőtlenségben ≤ helyett <, ≥ helyett pedig > szerepel. Az f függvény konvexsége tehát azt jelenti, hogy az értelmezési tartományában fekvő
bármely [x,¡y] interval¢ lum esetén ¡ ¢ az f grafikonjának ezen intervallum feletti darabja az x, f (x) és y, f (y) pontokat összekötő szakasz, az úgynevezett szelő alatt marad, mı́g a konkáv függvények grafikonja esetében ez éppen fordı́tva történik. Egy másik lehetséges szemléltetés a konvex függvények esetében úgy hangozhat, hogy az f grafikonjának az [x, y] intervallum feletti darabja az intervallum bármely pontjában a függvény görbéjéhez húzott érintő felett halad, mı́g konkáv függvények esetében ez éppen fordı́tva teljesül. Például, minden olyan függvény, amelynek grafikonja egy intervallum felett egyenes szakasz, nyilván egyidejűleg konvex is és konkáv is. A korábbi példák közül az idR függvény nyilván konvex is és konkáv is, mı́g az egészrész-függvény, a törtrész-függvény és az előjelfüggvény sem nem konvex, sem nem
konkáv. Az abszolútérték-függvény konvex A valós függvények alaki tulajdonságai mellett fontos szerepet játszanak a zérushelyek. Legyen D a valós számok halmazának tetszőleges részhalmaza és f : D  R egy függvény. Azt mondjuk, hogy a D-beli x0 valós szám az f függvény zérushelye, ha f (x0 ) = 0 teljesül. Ez geometriailag azt jelenti, hogy a függvény görbéje az x-tengelyt x0 -ban metszi. Például, a 0 nyilván minden páratlan függvénynek zérushelye.  3.8  Hatványfüggvények  A következőkben összefoglaljuk azokat a legfontosabb tudnivalókat, amelyek az úgynevezett elemi függvényekkel kapcsolatosak. Az ”elemi függvény” kifejezést itt kissé határozatlan értelemben használjuk Azt mondhatjuk, hogy azokat a függvényeket nevezzük ”elemi függvényeknek”, amlyeket az alábbiakban felsorolunk. Ezen függvények többsége a középiskolában előfordul, s itt arra
törekszünk, hogy lehetőleg korrekt módon értelmezzük őket, és összefoglaljuk legalapvetőbb tulajdonságaikat Legyen n pozitı́v egész szám és bármely valós x esetén legyen f (x) = xn .  (34)  Az f függvényt n-edfokú hatványfüggvénynek nevezzük. Ezt a függvényt tehát az x 7 xn hozzárendelési szabály értelmezi. A függvény értelmezési tartománya a valós számok halmaza. Például, az elsőfokú x 7 x hatványfüggvény az idR függvény, a másodfokú hatványfüggvény az x 7 x2 függvény, stb. Ezeket a     110  A függvénytan elemei  függvényeket összefoglalóan pozitı́v egész kitevőjű hatványfüggvényeknek nevezzük. E függvények értékkészlete attól függően a nem negatı́v valós számok halmaza, illetve a valós számok halmaza, hogy az n kitevő páros, illetve páratlan. Páros n kitevő esetén az n-edfokú hatványfüggvény páros
függvény, mı́g páratlan kitevő esetén páratlan függvény. Ezek a függvények egyetlen kitevő esetén sem periodikusak, viszont páratlan kitevő esetén szigorúan monotonak. Egyetlen páros kitevőjű hatványfüggvény sem monoton, viszont mindegyik alulról korlátos, minimuma a 0, s egyetlen minimumhelye a 0. A páratlan kitevőjű hatványfüggvények sem alulról, sem felülről nem korlátosak A páros kitevőjű hatványfüggvények mindegyike konvex, mı́g a páratlan kitevőjű hatványfüggvények a nem negatı́v valós számok halmazára leszűkı́tve konvexek, a nem pozitı́v valós számok halmazára leszűkı́tve pedig konkávok. A páros kitevőjű hatványfüggvények grafikonja az x 7 x2 függvényéhez, a páratlan kitevőjű hatványfüggvényeké pedig az x 7 x3 függvényéhez hasonló. Az alábbiakban ezek grafikonját láthatjuk. 1 0.8 0.6 0.4 0.2  -1  -0.5  0.5  1  2 
5. Ábra: Az x 7 x függvény  0.02  0.01  -1  -0.5  0.5 -0.01  -0.02 6. Ábra: Az x 7 x3 függvény  1     3.8 Hatványfüggvények  111  A pozitı́v egész kitevőjű hatványfüggvények közül tehát a páratlan kitevőjűek szigorúan növekvők, ı́gy ezek kölcsönösen egyértelműek, s inverz függvényük is szigorúan monoton növekvő. A páratlan kitevőjű hatványfüggvények tehát a valós számok halmazát bijektı́v módon képezik önmagára, ezek a valós számok halmazának bijekciói. Könnyű látni, hogy ha n páratlan pozitı́v egész, akkor√az 1 x 7 xn függvény inverze az x 7 x n , függvény, vagy másképpen az x 7 n x függvény. Ez a függvény tehát a valós számok halmazának ugyancsak bijekciója, ı́gy sem alulról, sem felülről nem korlátos, a nem negatı́v valós számok halmazára leszűkı́tve konkáv, a nem pozitı́v√valós számok halmazára
leszűkı́tve pedig konvex. A következő ábrán az x 7 3 x függvény, az úgynevezett köbgyök-függvény grafikonja látható.  1  0.5  -1  -0.5  0.5  1  -0.5  -1 √ 7. Ábra: Az x 7 3 x függvény  A páros egész kitevőjű hatványfüggvények nem kölcsönösen egyértelműek, hiszen ha n páros egész szám, akkor xn = (−x)n , ám a nem negatı́v valós számok halmazára leszűkı́tve őket, már szigorúan monoton növekvő, tehát kölcsönösen egyértelmű függvényeket kapunk. Ha tehát n páros pozitı́v egész szám, akkor az x 7 xn függvény a nem negatı́v valós számok halmazát bijektı́v módon képezik önmagára, ezek a nem negatı́v valós számok halmazának bijekciói. A nem negatı́v valós számok halmazán értelmezett x √ 7 xn függvény inverze páros 1 n esetén is az x 7 x n függvény, vagyis az x 7 n x függvény, az n-edik gyök függvény. Ezek a
függvények alulról korlátosak, minimumuk 0, melyet egyedül a 0 pontban vesznek fel. A függvények szigorúan monoton növekvők és konkávok. √ Az alábbi ábrán az x 7 x függvény, az úgynevezett négyzetgyök-függvény grafikonja látható.     112  A függvénytan elemei  2  1.5  1  0.5  1  2  3 √ 8. Ábra: Az x 7 x függvény  4  5  Általában a páratlan kitevőjű gyökfüggvények grafikonja a köbgyök-függvényéhez, mı́g a páros kitevőjűek grafikonja a négyzetgyök-függvényéhez hasonló. Ha tehát a nem negatı́v valós számok halmazára korlátozódunk, akkor a pozitı́v egész kitevőjű hatványfüggvények mind alulról korlátos, a 0 pontban 0 minimumértékkel rendelkező szigorúan monoton növekvő konvex bijekciók, mı́g inverzeikre, a pozitı́v egész kitevőjű gyök-függvényekre ugyanez igaz a konvexség helyett konkávsággal.  3.9  Polinomok  Az
elemi függvények egyik legegyszerűbb tı́pusát képezik a polinomok. Az f : R  R függvényt polinomnak nevezzük, ha van olyan n természetes szám, valamint vannak olyan a0 , a1 , .   , an valós számok, hogy minden valós x esetén f (x) = an xn + an−1 xn−1 + · · · + a1 x + a0  (35)  teljesül, valamint an 6= 0. Az n természetes számot az f polinom fokszámának, vagy fokának nevezzük, az a0 , a1 , .   , an számokat pedig az együtthatóinak Az an szám neve:főegyüttható. Az a0 számot szokás a polinom szabad tagjának, vagy konstans tagjának nevezni. Megállapodás szerint az azonosan nulla függvényt is polinomnak tekintjük, ez az úgynevezett nulla polinom, vagy nullpolinom, ám ennek fokszámát nem értelmezzük, együtthatói pedig mind 0-val egyenlők. A nulladfokú polinom tehát a nem azonosan nulla konstans függvényeket jelenti. Az elsőfokú polinomokat, melyek általános alakja tehát f
(x) = a x + b , ahol a, b tetszőleges valós számok és a 6= 0, szokás lineáris függvénynek is nevezni, bár az affin függvény pontosabb elnevezés. A másodfokú polinomok általános alakja f (x) = a x2 + b x + c tetszőleges a, b, c valós számokkal, ahol a 6= 0.     Exponenciális függvények  113  A későbbiekben látni fogjuk, hogy a páratlan fokszámú polinomok értékkészlete a valós számok halmaza, ám a páros fokszámú, legalább elsőfokú polinomok alulról, vagy felülről korlátosak, továbbá minimumuk, vagy maximumuk van attól függően, hogy főegyütthatójuk pozitı́v, vagy negatı́v, de a másik irányból nem korlátosak. A minimum, illetve maximum értéke döntő mértékben függ a polinom további együtthatóitól, ı́gy azokról általánosságban semmit nem lehet mondani. Ugyanı́gy, a monotonitás és a konvexitás-konkávitás is minden egyes esetben
külön vizsgálatot igényel. A zérushelyekkel kapcsolatban azonban tehetünk általános megjegyzéseket Így például, minden nem nulla polinomnak legfeljebb annyi zérushelye van, amennyi a fokszáma. Másrészt, minden páratlan fokszámú polinomnak van zérushelye. Az alábbiakban két polinom grafikonját láthatjuk.  10 5  -2  -1  1  2  -5 -10  9. Ábra: Az x 7 2x5 − 2x4 + 4x3 − 3x2 − 6x + 1 függvény  60  40  20  -2  -1  1  10. Ábra: Az x 7 x6 − 2x5 + 7x3 − x2 + 6x − 1 függvény  2     114  3.10  A függvénytan elemei  Exponenciális függvények  Legyen most a > 0 pozitı́v valós szám, melyről feltesszük, hogy a 6= 1. Minden valós x esetén legyen fa (x) = ax .  (36)  A hatványozás korábbi értelmezése szerint az fa függvény valóban minden valós x esetén értelmezve van. Az fa függvényt a alapú exponenciális függvénynek nevezzük. A hatványozás azonosságai szerint fa
eleget tesz a következő alapvető egyenlőségnek, másszóval függvényegyenletnek, melyet az exponenciális függvény addı́ciós tételének is szokás nevezni: fa (x + y) = fa (x) · fa (y)  (37)  bármely valós x, y esetén. A függvény 0 < a < 1 esetén szigorúan monoton csökkenő, mı́g a > 1 esetén szigorúan monoton növekvő, mindkét esetben konvex, és értékkészlete mindkét esetben a pozitı́v valós számok halmaza, viszont sem minimuma, sem maximuma nincs. Az fa tehát az a-ra tett feltételek mellett a valós számok halmazának a pozitı́v valós ¡ ¢x számok halmazára való bijekciója. Az alábbiakban az x 7 2x és az x 7 21 függvények grafikonját láthatjuk, melyeknek alakja az a > 1, illetve 0 < a < 1 eseteknek megfelelő exponenciális függvényeket jól reprezentálja.  8  6  4  2  -3  -2  -1  1 x  11. Ábra: Az x 7 2 függvény  2  3    
Logaritmusfüggvények  115 8  6  4  2  -3  -2  -1 12. Ábra: Az x 7  1  2  3   1 x függvény 2  Látható, hogy az előbbi két grafikon az y-tengelyre nézve egymás¡tükörképe. ¢x Ez a tulajdonság a hatványozással kapcsolatban fentebb megismert a1 = a−x azonosságnak köszönhető. A minden pozitı́v valós a számra fennálló a0 = 1 megállapodás következménye az, hogy mindezek a grafikonok az y tengelyt az y = 1 pontban metszik. Így válik érthetővé geometriailag is ennek a megállapodásnak a célszerűsége: ez az egyetlen lehetőség, ha azt akarjuk, hogy az exponenciális függvények görbéjén ne legyen ”szakadás”.  3.11  Logaritmusfüggvények  Továbbra is tegyük fel, hogy az a valós számra teljesül 0 < a 6= 1. Minden pozitı́v valós x esetén legyen ga (x) = loga x .  (38)  A logaritmus értelmezése szerint a ga függvény minden pozitı́v valós x esetén értelmezve van.
A ga függvényt a alapú logaritmusfüggvénynek nevezzük A hatványozás ismert azonosságai szerint ga eleget tesz az alábbi függvényegyenletnek: bármely pozitı́v valós x, y esetén ga (x · y) = ga (x) + ga (y) .  (39)  Könnyen látható, hogy a ga és a fenti fa függvények egymás inverzei. Ebből következnek a logaritmusfüggvény legegyszerűbb tulajdonságai: a ga függvény 0 < a < 1 esetén szigorúan monoton csökkenő és konvex, mı́g a > 1 esetén szigorúan monoton növekvő és konkáv, értékkészlete mindkét esetben a valós számok halmaza. Ebből adódóan a logaritmusfüggvények sem alulról, sem felülről nem korlátosak. A ga tehát az a-ra tett feltételek mellett a pozitı́v valós számok halmazának a valós számok halmazára való bijekciója. Az alábbiakban az x 7 log2 x és az x 7 log 21 x függvények grafikonját láthatjuk, melyeknek alakja az a > 1,
illetve 0 < a < 1 eseteknek megfelelő logaritmusfüggvényeket reprezentálja.     116  A függvénytan elemei  2  1  2  3  4  5  4  5  -2  -4  -6 13. Ábra: Az x 7 log2 x függvény  6  4  2  1  2  3  -2 14. Ábra: Az x 7 log 1 x függvény 2  A két grafikon ismét egymás tükörképe, ezúttal az x-tengelyre nézve. Ez valójában a loga x = − log a1 x nyilvánvaló azonosság geometriai kifejeződése, mely ¡ ¢x természetesen ugyancsak az a1 = a−x összefüggés következménye. Meg lehet mutatni, hogy a (37) és (39) egyenletek bizonyos értelemben jellemzik az exponenciális függvényeket, illetve a logaritmusfüggvényeket. Ezt úgy kell érteni, hogy ha például f : R  R szigorúan monoton növekvő függvény, melyre minden valós x, y mellett fennáll a (37) egyenlet, akkor van olyan egyértelműen meghatározott a > 1 valós szám, hogy minden valós x mellett f (x) = ax     Trigonometrikus
függvények  117  teljesül. Hasonlóan, ha g : {x| x > 0}  R szigorúan monoton növekvő függvény, melyre minden valós x, y mellett fennáll a (39) egyenlet, akkor van olyan egyértelműen meghatározott a > 1 valós szám, hogy minden valós x mellett g(x) = loga x teljesül. Ezeket az egyenleteket tehát fel lehet használni az exponenciális függvények, illetve a logaritmusfüggvények definiálására Más kérdés, hogy egyáltalán nem könnyű igazolni ezen függvények ismerete nélkül, hogy ezeknek az egyenleteknek létezik olyan megoldása, amely szigorúan monoton növekvő. Valójában ugyanazt az utat kellene végigjárni, mint a valós számok hatványozásának, illetve logaritmusának értelmezésekor.  3.12  Trigonometrikus függvények  A trigonometrikus függvények fogalma a középiskolából többé-kevésbé ismeretes. Ugyanakkor ezeknek a függvényeknek a középiskolában
szokásos értelmezése semmiképpen nem tekinthető korrekt matematikai definı́ciónak A ”szögfüggvények” értelmezése még ugyan lehetséges a derékszögű háromszög geometriai tulajdonságai alapján a megszokott módon, ám a legnagyobb problémát az jelenti, hogy mit kell például cos x alatt érteni, ha x egy tetszőleges valós szám. Ahhoz, hogy a hegyesszögekre értelmezett koszinusz-fogalmat úgy átalakı́tsuk, hogy egy tetszőleges x valós szám koszinuszáról és további ”szögfüggvényeiről” értelmesen lehessen beszélni, mindenképpen szükség van az ı́vmérték, vagy radián fogalmára, amelynek értelmezéséhez viszont az ı́vhossz fogalma szükséges. Az ı́vhossz értelmezéséhez azonban már a valós analı́zis olyan eszköztárára van szükség, amely középiskolás szinten még nem áll rendelkezésre. Mindenesetre, a radián értelmezéséhez elég
lenne azt tudnunk, hogy mi az, hogy π? Ezt a fogalmat a továbbiakban mintegy ”alapfogalomként” fogjuk használni, ugyanis jelenleg nincsenek meg az értelmezéséhez szükséges eszközeink. A középiskolában a π számot úgy szokták értelmezni, hogy az egy tetszőleges kör kerületének és átmérőjének hányadosa. Ezzel csak az a probléma, hogy mit értsünk ”kerület” alatt? Ismét visszajutottunk az ı́vhossz-problémához. Természetesen hasonló gondot okozna a π olyan értelmezése, amely a kör területével hozza összefüggésbe ezt a számot, hiszen a ”terület” fogalma legalább annyira bonyolult, mint az ı́vhosszé. Jelen céljaink szempontjából elég annyit tudnunk, hogy a π egy rögzı́tett valós számot jelöl, amely egyébként irracionális, de ez most nem lényeges, másrészt értéke 3 és 4 közé esik. Az antik matematikában egyébként a π
közelı́tésére a 22 7 racionális számot szokták használni, ami két 62832 , amely viszont már tizedes jegyre pontos. Egy másik racionális közelı́tés 20000 négy tizedes jegyre pontos. Az első trigonometrikus függvény, amelyet értelmezni fogunk a koszinusz függvény. Az értelmezéshez szükségünk lesz a következő tételre 3.121 Tétel Pontosan egy olyan c : R  R függvény létezik, mely a [0, π] intervallumon szigorúan monoton csökkenő, 2π szerint periodikus, és minden     118  A függvénytan elemei  valós x, y esetén teljesül rá: c(x + y) + c(x − y) = 2 c(x) c(y) .  (40)  A tételt nem bizonyı́tjuk. A tétel szerint a feltételeknek megfelelő, egyértelműen meghatározott c : R  R függvényt koszinusz függvénynek nevezzük és cos módon jelöljük. Tehát az x 7 cos x függvényről a fenti tételben felsorolt tulajdonságokat tudjuk, a koszinusz függvény további
”ismert” tulajdonságait ezekből kell tudni levezetnünk, s ezt tesszük a következő tételben. 3.122 Tétel A fentiekben értelmezett cos függvény rendelkezik az alábbi tulajdonságokkal: (i) cos 0 = 1 ,  cos π = −1 ,  cos π2 = 0 ,  (ii) a cos függvény páros , (iii) cos(x + π) = − cos x teljesül minden valós x esetén, ı́gy a cos függvény 2π szerint periodikus , (iv) | cos x| ≤ 1 minden valós x esetén . Bizonyı́tás. Helyettesı́tsünk a (40) egyenletbe tetszőleges valós x mellett y = 0-t, ekkor 2 cos x = 2 cos x · cos 0 adódik, s mivel a cos nem azonosan nulla, ı́gy cos 0 = 1 következik. Ha most a (40) egyenletben tetszőleges valós y mellett az x = 0 helyettesı́tést végezzük el, akkor cos y + cos(−y) = 2 cos y adódik, melyből kapjuk, hogy cos páros függvény. Ezután végezzük el a (40) egyenletben tetszőleges valós x mellett az y = π helyettesı́tést, ekkor cos(x + π) + cos(x
− π) = 2 cos x cos π következik. Mivel a cos 2π szerint periodikus, ı́gy cos(x + π) = cos(x − π) érvényes minden valós x mellett, s a fenti egyenletből azt kapjuk, hogy cos(x + π) = cos x cos π  (41)  teljesül ugyancsak minden valós x esetén. Az x = π helyettesı́tés után ¡ ¢2 1 = cos 2π = cos π következik, amiből cos π = ±1. A cos függvény szigorúan monoton csökkenő, ı́gy cos π = −1. Ha a (40) egyenletben az x = y = π2 helyettesı́tést alkalmazzuk, akkor ¡ π ¢2 cos π + cos 0 = 2 cos 2     3.12 Trigonometrikus függvények  119  adódik, s itt a bal oldalon nulla áll, amiből cos π2 = 0 következik. Ezzel az első és a második állı́tást igazoltuk. A harmadik állı́tás a (41) egyenlet és cos π = −1 következménye. Végül az utolsó állı́tás abból adódik, hogy a cos függvény páros, 2π szerint periodikus, cos 0 = 1, cos π = −1, és a függvény a [0, π]
intervallumon szigorúan monoton csökkenő. A tételt bebizonyı́tottuk A koszinusz függvény értékkészlete tehát a [−1, 1] intervallum része, minimuma −1, melyet a (2k + 1) π helyeken veszi fel, maximuma pedig 1, melyet a 2k π helyeken veszi fel, ahol k tetszőleges egész szám. A függvény a [2k π, (2k + 1) π] alakú intervallumokon szigorúan monoton csökkenő, a [(2k + 1) π, 2k π] alakú intervallumokon szigorúan monoton növekvő, a [ π2 + 2k π, π2 + (2k + 1) π] alakú intervallumokon konvex, a [ π2 + (2k + 1) π, π2 + 2k π] alakú intervallumokon pedig konkáv, ahol k ismét tetszőleges egész szám. A függvény garfikonja három teljes perióduson az alábbi ábrán látható. 1  0.5  -3  -1  -2  1  2  3  -0.5  -1 15. Ábra: Az koszinusz függvény  Most értelmezzük a következő trigonometrikus függvényt. Bármely valós x esetén legyen π (42) sin x = − cos(x + ) . 2 Az x 7 sin x
függvényt szinusz függvénynek nevezzük és sin módon jelöljük. A koszinusz függvényhez hasonlóan tehát a szinusz függvény is az egész valós számegyenesen van értelmezve, s az alábbiakban felsoroljuk legfontosabb tulajdonságait. 3.123 Tétel A fentiekben értelmezett sin függvény rendelkezik az alábbi tulajdonságokkal: (i) sin 0 = 1 ,  sin π = 0 ,  sin π2 = 1 ,  (ii) a sin függvény páratlan, 2π szerint periodikus és a [− π2 , π2 ] intervallumon szigorúan monoton növekvő ,     120  A függvénytan elemei  (iii) sin(x + π) = − sin x teljesül minden valós x esetén , (iv) | sin x| ≤ 1 minden valós x esetén . Bizonyı́tás. Az első állı́tás a sin értelmezéséből és a 3122 tétel első állı́tásából adódik. A definı́cióból az is következik, hogy a sin függvény 2π szerint periodikus Ha x tetszőleges valós szám, akkor sin(−x) = − cos(−x +  π π π )
= − cos(x − ) = cos(x + ) = − sin x , 2 2 2  ahol felhasználtuk, hogy cos páros, valamint a (41) azonosságot. Legyen most − π2 < x < y < π2 , ekkor 0 < x + π2 < y + π2 < π, s mivel a cos a [0, π] intervallumon szigorúan csökken, ı́gy a sin a [− π2 , π2 ] intervallumon szigorúan nő. Ha x tetszőleges valós szám, akkor a 3.122 tétel harmadik állı́tása alapján sin(x + π) = − cos(x +  π π + π) = cos(x + ) = − sin x , 2 2  tehát az első három állı́tást igazoltuk. Az utolsó állı́tás nyilvánvaló, ı́gy a tételt bebizonyı́tottuk. A szinusz függvény értékkészlete tehát a [−1, 1] intervallum része, minimuma −1, melyet a − π2 + 2k π helyeken veszi fel, maximuma pedig 1, melyet a π2 + 2k π helyeken veszi fel, ahol k tetszőleges egész szám. A függvény a [− π2 + 2k π, π2 + 2k π] alakú intervallumokon szigorúan monoton növekvő, a [ π2 + 2k π, 3π 2
+ 2k π] alakú intervallumokon szigorúan monoton csökkenő, a [2k π, (2k + 1) π] alakú intervallumokon konkáv, a [(2k + 1) π, 2k π] alakú intervallumokon pedig konvex, ahol k ismét tetszőleges egész szám. A függvény garfikonja három teljes perióduson az alábbi ábrán látható. 1  0.5  -7.5  -5  -2.5  2.5  -0.5  -1 16. Ábra: Az szinusz függvény  5  7.5     3.12 Trigonometrikus függvények  121  A következő tétel a koszinusz és szinusz függvények néhány további alapvető tulajdonságát foglalja össze. 3.124 Tétel A koszinusz és szinusz függvények rendelkeznek a következő tulajdonságokkal: minden valós x, y esetén (i) cos(x + y) = cos x cos y − sin x sin y , (ii) sin(x + y) = sin x cos y + cos x sin y , (iii) cos(x − y) = cos x cos y + sin x sin y , (iv) sin(x − y) = sin x cos y − cos x sin y , (v) cos 2x = cos2 x − sin2 x , (vi) sin 2x = 2 sin x cos x , (vii) cos2 x + sin2 x = 1 .
Bizonyı́tás. Az első állı́tás bizonyı́tása a következő számolással végezhető el, melynek során ismételten felhasználjuk a fentiekben már bizonyı́tott összefüggéseket: cos x cos y − sin x sin y = cos x cos y − cos(x + =  π π ) cos(y + ) = 2 2  ¤ 1£ cos(x + y) + cos(x − y) − cos(x + y + π) − cos(x − y) = cos(x + y) . 2  Hasonlóan, sin x cos y + cos x sin y = − cos(x + =  π π ) cos y − cos x cos(y + ) = 2 2  π π π π ¤ 1£ − cos(x + y + ) − cos(x − y + ) − cos(x + y + ) − cos(x − y − ) = 2 2 2 2 2 = sin(x + y) − = sin(x + y) − = sin(x + y) +  π 1 π 1 cos(x − y + ) − cos(x − y − ) = 2 2 2 2  π 1 π 1 cos(x − y − + π) − cos(x − y + ) = 2 2 2 2  π 1 π 1 cos(x − y − ) − cos(x − y − ) = sin(x + y) . 2 2 2 2  A harmadik és negyedik állı́tást az első kettőből kapjuk y helyett −y-t ı́rva, mı́g az ötödik és hatodik ugyancsak az első kettőből
következik az x = y helyettesı́téssel. Az utolsó állı́tás a harmadikból adódik x = y helyettesı́téssel Ezzel a tételt igazoltuk.     122  A függvénytan elemei  A tétel első két állı́tása a koszinusz, illetve szinusz függvény addı́ciós tétele, mı́g a harmadik és negyedik a megfelelő szubtrakciós tételek. Az ötödik és hatodik azonosságok neve: kétszeres szögekre vonatkozó összefüggések, mı́g az utolsó állı́tás az úgynevezett trigonometrikus Pithagorasz–tétel. Megjegyezzük, hogy ezekből az azonosságokból könnyen levezethetők a félszögekre vonatkozó ismert összefüggések is, amit az Olvasóra bı́zunk. Felhı́vjuk a figyelmet, hogy ezek szerint a koszinusz és szinusz függvényekre vonatkozó minden lényeges, a középiskolából már jól ismert tudnivaló az alapvető 3.121 tételből adódik Javasoljuk az Olvasónak, hogy igyekezzen önállóan
továbbbi egyszerű összefüggéseket keresni és igazolni az eddig megismert két trigonometrikus függvénnyel kapcsolatban. Tegyük most fel, hogy x valós szám, melyre x 6= π2 + kπ, ahol k egész szám. Ekkor legyen sin x . (43) tan x = cos x Az x 7 tan x függvényt tangens függvénynek nevezzük és tan módon jelöljük. A tangens függvény tehát a valós számok halmazának azon a részhalmazán van értelmezve, amelyen a koszinusz függvény nullától különböző értéket vesz fel. Ez a halmaz az összes ] − π2 + kπ, π2 + kπ[ nyı́lt intervallumok egyesı́tése, ahol k tetszőleges egész szám. Ezek az intervallumok páronként diszjunktak, s a szomszédosok közös végpontjai a π2 + kπ alakú számok, ahol k egész szám. Ezekben a pontokban a tangens függvény tehát nincs értelmezve. A következő tételben összefoglaljuk a tangens függvény néhány fontos tulajdonságát.
3.125 Tétel A fentiekben értelmezett tan függvény rendelkezik az alábbi tulajdonságokkal: (i) tan 0 = 0 ,  tan π4 = 1 ,  (ii) a tan függvény páratlan, π szerint periodikus és a ] − π2 , π2 [ intervallumon szigorúan monoton növekvő , (iii) a tan függvény értékkészlete a valós számok halmaza . Bizonyı́tás. Az első állı́tás a korábbiak egyszerű következménye, s az is, hogy a tangens függvény páratlan és π szerint periodikus. A szigorú növekedésre és az értékkészletre vonatkozó állı́tások egyszerű bizonyı́tásához e pillanatban még nincsenek meg a megfelelő eszközeink. A tangens függvénnyel kapcsolatban megjegyezzük, hogy a ]kπ, π2 + kπ[ intervallumokon konvex, a ] π2 + kπ, π + kπ[ intervallumokon pedig konkáv, minden k egész szám esetén. A tangens függvény addı́ciós és szubtrakciós tételét könnyen megkaphatjuk a szinusz és a koszinusz
függvények hasonló tételeiből. Ezek megfogalmazását és bizonyı́tását az Olvasóra bı́zzuk. A tangens függvény grafikonját egy teljes perióduson az alábbi ábrán láthatjuk.     3.12 Trigonometrikus függvények  123  75 50 25 -1.5  -1  -0.5  0.5  1  1.5  -25 -50 -75 17. Ábra: A tangens függvény  A következő trigonometrikus függvény lényegében a tangens reciproka. Legyen x valós szám, melyre x 6= kπ, ahol k egész szám, s ekkor cot x =  cos x . sin x  (44)  Az x 7 cot x függvényt kotangens függvénynek nevezzük és cot módon jelöljük. A kotangens függvény tehát a valós számok halmazának azon a részhalmazán van értelmezve, amelyen a szinusz függvény nullától különböző értéket vesz fel. Ez a halmaz pontosan az összes ]kπ, (k + 1)π[ nyı́lt intervallumok egyesı́tése, ahol k tetszőleges egész szám. Ezek az intervallumok páronként diszjunktak, s a
szomszédosok közös végpontjai a kπ alakú számok, ahol k egész szám. Ezekben a pontokban a kotangens függvény tehát nincs értelmezve, hiszen a kotangens függvény pontosan azokban a pontokban nincs értelmezve, amelyekben a tangens függvény 0 értéket vesz fel. A tangens és kotangens függvények tehát értelmezési tartományaik közös részén egymás recipokai. A következő tételben összefoglaljuk a kotangens függvény néhány fontos tulajdonságát. 3.126 Tétel A fentiekben értelmezett cot függvény rendelkezik az alábbi tulajdonságokkal: (i) cot π2 = 0 ,  cot π4 = 1 ,  (ii) a cot függvény páratlan, π szerint periodikus és a ]0, π[ intervallumon szigorúan monoton csökkenő , (iii) a cot függvény értékkészlete a valós számok halmaza , (iv) minden kπ < x < kπ + π2 esetén fennáll tan x · cot x = 1 . A bizonyı́tás a 3.125 tétel bizonyı́tásához hasonló,
s az Olvasóra bı́zzuk     124  A függvénytan elemei  A kotangens függvénnyel kapcsolatban megjegyezzük, hogy a ]kπ, π2 + kπ[ intervallumokon konvex, a ] π2 + kπ, π + kπ[ intervallumokon pedig konkáv, minden k egész szám esetén. A kotangens függvény addı́ciós és szubtrakciós tételét ugyancsak megkaphatjuk a szinusz és a koszinusz függvények hasonló tételeiből. Ezek megfogalmazását és bizonyı́tását az Olvasóra bı́zzuk A kotangens függvény grafikonját egy teljes perióduson az alábbi ábrán láthatjuk  75 50 25 0.5  1  1.5  2  2.5  3  -25 -50 -75 18. Ábra: A kotangens függvény  Megjegyezzük, hogy az eddig bevezetett négy trigonometrikus függvény között számos további összefüggés, azonosság áll fenn. Különösen érdekesek azok a formulák, amelyek arra vonatkoznak, hogy egy adott trigonometrikus függvény segı́tségével hogyan lehet az összes többit
algebrai formában kifejezni. Javasoljuk az Olvasónak, hogy próbáljon meg minél több ilyen formulát önállóan felkutatni, s azokat bebizonyı́tani.  3.13  Inverz trigonometrikus függvények  A cı́mben látszólag azt is mondhattuk volna, hogy ”A trigonometrikus függvények inverzei”, ám ez értelmetlen lett volna, hiszen négy periodikus függvényről van szó, s egy periodikus függvény nyilván nem lehet kölcsönösen egyértelmű, kivéve, ha értelmezési tartománya üres, vagy egyetlen pontból áll, ám az ilyen függvényekre nem vagyunk kiváncsiak. Tehát az ”Inverz trigonometrikus függvények” cı́m mást jelent, mégpedig azt, hogy ezen függvények bizonyos leszűkı́téseinek inverzeiről lesz szó A fentiekben láttuk, hogy a négy trigonometrikus függvény mindegyike alkalmas intervallumokon szigorúan monoton. Az alábbiakban mind a négy trigonometrikus függvény esetében
rögzı́teni fogunk egy-egy ilyen intervallumot, s felsoroljuk függvényeinknek az illető intervallumra való leszűkétéséhez tartozó inverzek főbb tulajdonságait. Ezeket az ”alkalmas intervallumokat” általában nem az egyetlen lehetséges módon, hanem valamilyen hagyománynak megfelelően fogjuk kiválasztani.     3.13 Inverz trigonometrikus függvények  125  A fentiekben láttuk, hogy a koszinusz függvény a [0, π] intervallumon szigorúan monoton csökkenő. A koszinusz függvény erre az intervallumra való szűkı́tésének inverzét arkusz koszinusz függvénynek nevezzük és arccos módon jelöljük. Az x 7 arccos x függvény tehát a [−1, 1] intervallumot bijektı́v módon képezi a [0, π] intervallumra. Bármely [−1, 1]-beli x valós szám esetén arccos x azt az egyértelműen meghatározott y valós számot jelenti a [0, π] intervallumban, amelyre cos y = x teljesül, másszóval, minden
−1 ≤ x ≤ 1 esetén fennáll cos(arccos x) = x .  (45)  Ugyanakkor az is igaz, hogy bármely [0, π]-beli x valós szám esetén cos x azt az egyértelműen meghatározott y valós számot jelenti a [−1, 1] intervallumban, amelyre arccos y = x teljesül, másszóval, minden 0 ≤ x ≤ π esetén fennáll arccos(cos x) = x .  (46)  Ez a két tulajdonság együtt értelmezi az arccos függvényt. A függvény szigorúan monoton csökkenő, minimuma 0, melyet 1-ben, maximuma pedig π, melyet −1ben vesz fel. A függvény a [−1, 0] intervallumon konvex, a [0, 1] intervallumon pedig konkáv. A függvény grafikonját a következő ábrán láthatjuk  3  2.5  2  1.5  1  0.5  0 -1  -0.5  0  0.5  1  x  19. Ábra: Az arkusz koszinusz függvény  Ugyancsak a fentiekben láttuk, hogy a szinusz függvény a [− π2 , π2 ] intervallumon szigorúan monoton növekvő. A szinusz függvény erre az intervallumra való szűkı́tésének
inverzét arkusz szinusz függvénynek nevezzük és arcsin módon jelöljük. Az x 7 arcsin x függvény tehát a [−1, 1] intervallumot bijektı́v módon képezi a [− π2 , π2 ] intervallumra. Bármely [−1, 1]-beli x valós szám esetén arcsin x azt az egyértelműen meghatározott y valós számot jelenti a [− π2 , π2 ] intervallumban, amelyre sin y = x teljesül, másszóval, minden −1 ≤ x ≤ 1 esetén fennáll sin(arcsin x) = x .  (47)     126  A függvénytan elemei  Ugyanakkor az is igaz, hogy bármely [− π2 , π2 ]-beli x valós szám esetén sin x azt az egyértelműen meghatározott y valós számot jelenti a [−1, 1] intervallumban, amelyre arcsin y = x teljesül, másszóval, minden − π2 ≤ x ≤ π2 esetén fennáll arcsin(sin x) = x .  (48)  Ez a két tulajdonság együtt jellemzi az arcsin függvényt. A függvény szigorúan monoton növekvő, minimuma − π2 , melyet −1-ben, maximuma pedig
π2 , melyet 1-ben vesz fel. A függvény a [−1, 0] intervallumon konkáv, a [0, 1] intervallumon pedig konvex. A függvény grafikonját a következő ábrán láthatjuk  1.5  1  0.5  0 -1  -0.5  0  0.5  1  x -0.5  -1  -1.5  20. Ábra: Az arkusz szinusz függvény  A tangens függvény a ]− π2 , π2 [ intervallumon szigorúan monoton növekvő. A tangens függvény erre az intervallumra való szűkı́tésének inverzét arkusz tangens függvénynek nevezzük és arctan módon jelöljük. Az x 7 arctan x függvény tehát a valós számok halmazát bijektı́v módon képezi a ] − π2 , π2 [ intervallumra. Bármely x valós szám esetén arctan x azt az egyértelműen meghatározott y valós számot jelenti a ] − π2 , π2 [ intervallumban, amelyre tan y = x teljesül, másszóval, minden valós x esetén fennáll tan(arctan x) = x .  (49)  Ugyanakkor az is igaz, hogy bármely ] − π2 , π2 [-beli x valós szám
esetén tan x azt az egyértelműen meghatározott y valós számot jelenti, amelyre arctan y = x teljesül, másszóval, minden − π2 < x < π2 esetén fennáll arctan(tan x) = x .  (50)  Ez a két tulajdonság együtt jellemzi az arctan függvényt. A függvény szigorúan monoton növekvő, korlátos, sem minimuma, sem maximuma nincs. A függvény a ] − ∞, 0] intervallumon konvex, a [0, +∞[ intervallumon pedig konkáv. A függvény grafikonját az alábbi ábrán láthatjuk.     3.13 Inverz trigonometrikus függvények  127  1  0.5  0 -4  -2  0  2  4  x -0.5  -1  21. Ábra: Az arkusz tangens függvény  Végül teljesen hasonlóan értelmezzük az arkusz kotangens függvényt. A kotangens függvény a ]0, π[ intervallumon szigorúan monoton csökkenő. A kotangens függvénynek erre az intervallumra való szűkı́tésének inverzét arkusz kotangens függvénynek nevezzük és arccot módon jelöljük. Az
x 7 arccot x függvény tehát a valós számok halmazát bijektı́v módon képezi a ]0, π[ intervallumra. Bármely x valós szám esetén arccot x azt az egyértelműen meghatározott y valós számot jelenti a ]0, π[ intervallumban, amelyre cot y = x teljesül, másszóval, minden valós x esetén fennáll cot(arccot x) = x .  (51)  Ugyanakkor az is igaz, hogy bármely ]0, π[-beli x valós szám esetén cot x azt az egyértelműen meghatározott y valós számot jelenti, amelyre arccot y = x teljesül, másszóval, minden 0 < x < π esetén fennáll arccot (cot x) = x .  (52)  Ez a két tulajdonság együtt jellemzi az arccot függvényt. A függvény szigorúan monoton csökkenő, korlátos, sem minimuma, sem maximuma nincs. A függvény a ] − ∞, 0] intervallumon konkáv, a [0, +∞[ intervallumon pedig konvex. A függvény grafikonját az alábbi ábrán láthatjuk.     128  A függvénytan elemei  2.5  2 
1.5  1  0.5  -4  -2  0  2  4  x  22. Ábra: Az arkusz kotangens függvény  A trigonometrikus függvények alaptulajdonságaiból számos érdekes összefüggés vezethető le az inverz trigonometrikus függvényekkel kapcsolatban. Például, bármely [−1, 1]-beli x esetén fennáll arccos x + arcsin x =  π , 2  s hasonlóan, bármely valós x esetén fennáll arctan x + arccot x =  π . 2  Javasoljuk az Olvasónak, hogy hasonló egyszerű összefüggéseket próbáljon önállóan felderı́teni és bizonyı́tani.     129  4  EGYENLETEK, EGYENLŐTLENSÉGEK  4.1  Megoldáshalmazok  A középiskolai tanulmányok során láthattuk, hogy a matematikában számos probléma olyan feladatok megoldására vezethető vissza, amikor valamilyen egyenletek, egyenlőtlenségek, illetve ilyenekből álló rendszerek összes megoldását kell meghatározni. Ezért már a középiskolában is különös hangsúlyt helyeznek az
egyenletek, illetve egyenlőtlenségek különböző tı́pusainak megoldására szolgáló módszerek vizsgálatára. Bizonyos algoritmusokkal ismertetnek meg, amelyek alkalmasak arra, hogy egyes alapvető egyenlet-, illetve egyenlőtlenség-osztályok megoldásait szinte gépiesen meg tudjuk határozni. Ebben a fejezetben ilyen jellegű problémákkal fogunk foglalkozni, miközben megpróbáljuk valamilyen értelemben rendszerezve áttekinteni azokat a legfontosabb probléma-tı́pusokat, amelyek egyenletekkel, egyenlőtlenségekkel kapcsolatban felmerülnek. Mindenekelőtt azt kellene tisztázni, hogy vajon mit értünk egyenlet, illetve egyenlőtlenség alatt, valamint ezek megoldása alatt. Mivel csak bizonyos speciális tı́pusú egyenletekkel, illetve egyenlőtlenségekkel kı́vánunk foglalkozni, ı́gy általánosságban nincs értelme kı́sérletet tenni ezek definiálására: bőven elég lesz, ha a vizsgált
tı́pusokat definiáljuk valamilyen módon. Maradjunk tehát annyiban, hogy egyenlet alatt egy F (x) = G(x)  (53)  alakú szimbólumot értünk, ahol F és G valamilyen valós függvények, s egy ilyen egyenlet megoldáshalmaza alatt mindazon x valós számok halmazát értjük, amelyek beletartoznak az F és G függvények értelmezési tartományainak közös részébe, s amelyekre fennáll az (53) egyenlőség. Egyébként az F és G függvények értelmezési tartományának közös részét szokás az (53) egyenlet értelmezési tartományának is nevezni. Esetenként a ”megoldáshalmaz” egy szűkebb halmazt jelenthet: ha például az adott egyenletnek csak racionális, vagy egész, vagy valamilyen egyéb feltételnek eleget tevő megoldásait keressük, amint azt a probléma természete megköveteli, akkor a megoldáshalmaz fogalmát értelemszerűen szűkı́teni kell. Ebben az értelemben egy (53) alakú
egyenlet megoldása alatt megoldáshalmazának egy elemét értjük Néha szokás a megoldásokat gyököknek is nevezni. Az (53) alakú egyenletet tehát akkor tekintjük megoldottnak, ha ismerjük a megoldáshalmazát Megjegyezzük, hogy mindez egyenlőtlenségekkel kapcsolatban is szó szerint elismételhető, csupán (53)-ben az = jelet a ≤, ≥, < vagy > jelek valamelyikével kell helyettesı́teni. Így a következő tı́pusú egyenlőtlenségeket kapjuk: F (x) ≤ G(x) ,  (54)  F (x) < G(x) ,  (55)  F (x) ≥ G(x) ,  (56)     130  Egyenletek, egyenlőtlenségek  és F (x) > G(x) ,  (57)  ahol F és G valamilyen valós függvények. Világos, hogy ezek az egyenletek, illetve egyenlőtlenségek mind a következő, úgynevezett nullára redukált alakra hozhatók: H(x) = 0 , (58) H(x) ≤ 0 ,  (59)  H(x) < 0 ,  (60)  és ahol H valamilyen adott valós függvény. Ekkor az egyenlet értelmezési tartománya
megegyezik H értelmezési tartományával Megjegyezzük, hogy bizonyos esetekben az (53), illetve az (54), (55), (56), (57) egyenlőtlenségek nullára redukálása nem biztos, hogy a legcélszerűbb módszer a probléma megoldása szempontjából. Az egyszerűség kedvéért a továbbiakban az ilyen problémákkal kapcsolatos általános mondandónkat az egyenletek esetére fogjuk megfogalmazni mindaddig, amı́g ez lényegében változatlanul érvényes a megfelelő egyenlőtlenségekre is. Megjegyezzük, hogy a felı́rt egyenletek és egyenlőtlenségek az úgynevezett egyismeretlenes egyenletek, illetve egyenlőtlenségek körébe tartoznak, ellentétben az úgynevezett többismeretlenes egyenletekkel, illetve egyenlőtlenségekkel, melyekkel azonban ezen a helyen nem foglalkozunk. Tehát az a feladat, hogy ”Oldjuk meg az (53) egyenletet!” azt jelenti, hogy határozzuk meg megoldáshalmazát. Ám az mit jelent, hogy
”határozzuk meg megoldáshalmazát”? Mint tudjuk, egy halmazt akkor tekintünk ismertnek, ha minden halmazról egyértelműen el lehet dönteni, hogy halmazunknak eleme, vagy sem. Márpedig ez az (53) egyenlet esetében annyit jelent, hogy  mondjuk a valós számok halmazában keresve a megoldásokat  bármely x valós számról el lehessen dönteni, hogy F (x) egyenlő-e G(x)-el. Valóban azt szoktuk érteni egy egyenlet megoldása alatt, hogy bármely szóbajövő valós szám esetén ki tudjuk számı́tani az egyenlet két oldalán álló kifejezést, s meg tudjuk állapı́tani, hogy azok egyenlők-e? Erről szó sincs, egy (53) alakú egyenletet akkor szoktunk ”megoldottnak” tekinteni, ha valahogy le tudtuk ı́rni a megoldáshalmazát. Igen ám, de ennek megint nem sok értelme van. Ugyanis tekintsük például a következő feladatot, amit mondjuk a középiskolában dolgozatpéldának adunk: Oldjuk meg az x2 −
3x + 2 = 0 egyenletet! Biztos lesz, aki erre a másodfokú egyenlet megoldóképletének felhasználásával azt ı́rja, hogy a megoldások x1 = 2 és x2 = 1, ami rendben is van, hiszen ezzel azt állı́tja, hogy az egyenlet megoldáshalmaza {x| x = 2 vagy x = 1}. Ám mit kezdjünk azzal, aki válaszként azt ı́rja, hogy az egyenlet megoldáshalmaza a {x| x2 − 3x + 2 = 0} halmaz? A válasz tökéletes, hiszen egy valós x pontosan akkor megoldása az egyenletnek, ha eleme ennek a halmaznak, amely egyértelműen definiálva van, hiszen minden valós számról kétséget kizáróan el lehet dönteni, hogy ehhez a halmazhoz     4.1 Megoldáshalmazok  131  tartozik, vagy nem. Ugyanakkor az is világos, hogy aki ezt a megoldást adja be, az nem csinált semmit. Világosan kell látnunk, hogy mi okozza ezt a problémát: az egyenlet megoldáshalmazának {x| x2 − 3x + 2 = 0} formában történő megadása nem elég ”explicit”,
valahogy arra vágyunk, hogy ”fel lehessen sorolni” az összes megoldásokat, vagy valami ”egyszerűbb” tulajdonsággal lehessen jellemezni őket. Igen ám, de az ilyesmi nyilván nem ”érzésre” megy, s pontosan meg kell fogalmaznunk, hogy mit akarunk, ha el akarjuk kerülni azt, hogy egy értelmesebb diák a fenti módon kibabráljon velünk. Azt nyilván nem nagyon várhatjuk, hogy a megoldásokat minden esetben fel lehessen sorolni, hiszen ez már egészen egyszerű egyenlőtlenségek esetében sem lehetséges. A következő elvárás viszont már elég ”értelmesnek” tűnik: egy (53) alakú egyenletet, vagy hasonló egyenlőtlenséget akkor tekintünk megoldottnak, ha meg tudunk adni olyan páronként diszjunkt intervallumokat, melyek egyesı́tése a megoldáshalmaz. Itt ”meg tudunk adni” alatt valami olyasmit kell érteni, hogy valamilyen módon meg tudjuk adni a szóbanforgó intervallumok végpontjainak
halmazát. ”Intervallum” alatt bármilyen intervallumot lehet érteni, melyek közé tartozik az üres halmaz is, az egypontos halmaz is, a végtelen intervallumok is, valamint az egész valós számok halmaza is. A tapasztalat azt mutatja, hogy a gyakorlatban előforduló egyenletek, illetve egyenlőtlenségek, sőt az ilyenekből képzett rendszerek esetén is ”megoldás” alatt valami ilyesmit szokás érteni, legalábbis ilyesmire szoktunk törekedni. Egy több egyenletből, illetve egyenlőtlenségből álló rendszer megoldáshalmaza nyilván a rendszert alkotó egyenletek, illetve egyenlőtlenségek megoldáshalmazainak közös része, ı́gy eleinte elegendő egyetlen egyenletből, vagy egyenlőtlenségből álló ”rendszerekkel” foglalkoznunk. A következőkben tehát olyan eljárásokkal szándékozunk foglalkozni, melyek segı́tségével bizonyos egyenleteket, illetve egyenlőtlenségeket ebben az
értelemben meg lehet oldani. Ha egy egyenlet, vagy egyenlőtlenség megoldáshalmaza az üres halmaz, akkor azt mondjuk, hogy az egyenletnek, vagy egyenlőtlenségnek nincs megoldása, ha pedig az egész valós számok halmaza, akkor azt mondjuk, hogy az illető egyenlet, vagy egyenlőtlenség azonosság. Ha két egyenletnek, vagy egyenlőtlenségnek ugyanaz a megoldáshalmaza, akkor azt fogjuk mondani, hogy a két egyenlet, vagy egyenlőtlenség ekvivalens. Ha az A egyenletnek, illetve egyenlőtlenségnek minden megoldása megoldása a B egyenletnek, vagy egyenlőtlenségnek is, akkor azt fogjuk mondani, hogy B az Anak következménye Ezek szerint tehát az A és B ekvivalenciája azt jelenti, hogy ezek kölcsönösen következményei egymásnak. Egy tetszőleges egyenlet, vagy egyenlőtlenség megoldásának menete általában olyan lépések egymásutánját jelenti, melyek során az egyenletnek, vagy egyenlőtlenségnek
valamilyen következményét igyekszünk megkeresni úgy, hogy véges sok lépés után a kapott egyenlet, vagy egyenlőtlenség megoldáshalmaza már felı́rható legyen az előző szakaszban emlı́tett módon. A számunkra legszerencsésebb eset az     132  Egyenletek, egyenlőtlenségek  volna, amikor az egyes lépésekben mindig az előzővel ekvivalens egyenletet kapunk, másszóval ekvivalens átalakı́tásokat hajtunk végre, ilyenkor ugyanis a kiindulási és a végső egyenlet, vagy egyenlőtlenség megoldáshalmaza azonos, tehát a problémát megoldottuk. Ha viszont ez nem ı́gy van, akkor a végső lépésben kapott halmazról csak annyit tudunk mondani, hogy tartalmazza az eredeti probléma megoldáshalmazát, s ilyenkor valamilyen további módszerrel, például visszahelyettesı́téssel ki kell szűrni azokat a számokat, amelyek a végső egyenletnek, vagy egyenlőtlenségnek megoldásai, de az eredetinek
nem. Ezek az úgynevezett hamis gyökök. Egyébként szinte bármilyen módszert választunk egyenletünk vagy egyenlőtlenségünk megoldására, mindenképpen célszerű az eljárás végén kapott ”potenciális megoldásokat” a kiindulási egyenletbe, illetve egyenlőtlenségbe visszahelyettesı́teni, hogy a számı́tások során esetleg fellépő hamis gyököket, vagy a gyarlóságunk folytán keletkezett esetleges számı́tási hibákat kiküszöböljük. Tehát a visszahelyettesı́tés a problémamegoldás szerves részének tekinthető. Megjegyezzük még, hogy egy adott egyenlettel, vagy egyenlőtlenséggel kapcsolatban az a kifejezés, hogy ”Oldjuk meg!” mindig azt fogja jelenteni  hacsak kifejezetten mást nem mondunk , hogy az értelmezési tartományán oldjuk meg a problémát, ami tehát a szokásos megállapodásnak megfelelően a valós számok halmazának az a legbővebb részhalmaza,
amelyen az egyenletben előforduló adott függvények mind értelmezve vannak. Néha hasznos lehet a megoldást azzal kezdeni, hogy megpróbáljuk valahogy leı́rni az egyenlet értelmezési tartományát, ám az iménti megállapodásunk fényében erre általában nincs szükség, hiszen a megoldási eljárás végén kapott potenciális gyököket úgyis vissza kell helyettesı́teni az eredeti egyenletbe, illetve egyenlőtlenségbe, s akkor úgyis kiderül, hogy esetleg a kapott értékek nem is tartoznak az értelmezési tartományhoz. Az értelmezési tartomány előzetes vizsgálata esetleg arra jó, hogy ha például kiderül, hogy az az üres halmaz, akkor a problémát máris megoldottuk. Egyéb esetekben ez a tevékenység inkább felesleges, esetenként különleges nehézségekkel járó idővesztegetés. Az Olvasó esetleg úgy érezheti, hogy ami itt folyik csupán szőrszálhasogatás, ám
hamar rájöhetünk, hogy nem ez a helyzet. A mindennapi életben is számos problémát okoz, amikor az egymással beszélő felek valójában elbeszélnek egymás mellett, hiszen nem tisztázták a beszélgetés során felhasznált fogalmak jelentését, ı́gy beszélgetésük a ”süketek párbeszéde”. Nos, legalább a matematikában igyekezzünk ezt elkerülni, hiszen látható, hogy erre van lehetőség.  4.2  Lineáris egyenletek  Lineáris egyenlet alatt olyan (53) alakú egyenletet értünk, melynél F és G lineáris függvények. Mivel ezek értelmezési tartománya egyaránt a valós számok halmaza, ı́gy egy lineáris egyenlettel kapcsolatban  ha mást nem mondunk  az egyenlet értelmezési tartománya alatt a valós számok halmazát fogjuk érteni. Figyelembe véve a lineáris függvények 3.9 pontban megadott általános alakját,     Másodfokú egyenletek  133  minden lineáris egyenlet ax =
b  (61)  formában ı́rható fel, ahol a, b tetszőleges valós számok és a 6= 0. Az egyenlet egyetlen megoldása x = ab , tehát a megoldáshalmaz az {x| x = ab } egyetlen pontból álló ”intervallum”. Ezzel a lineáris egyenletek megoldásának problémáját teljes egészében megoldottuk. Megjegyezzük, hogy az alkalmazásokban gyakran olyan lineáris egyenletekkel találkozunk, melyek F1 (x) + F2 (x) + · · · + Fn (x) = G1 (x) + G2 (x) + · · · + Gm (x) alakúak, ahol Fi , Gj lineáris függvények i = 1, 2, .   , n és j = 1, 2,    , m esetén Ilyenkor tehát az egyenlet két oldalán fellépő tagokat úgy rendezzük, hogy az egyik oldalon összegyűjtjük az elsőfokú, tehát az ”x-et tartalmazó” tagokat, a másik oldalon pedig a nulladfokú, tehát az ”x-et nem tartalmazó” tagokat abból a célból, hogy egy (61) alakú egyenletet kapjunk, ami ekvivalens az eredeti egyenlettel. Ezt a leggyakrabban
úgynevezett azonos átalakı́tásokkal érjük el, ami azt jelenti, hogy az egyenlet mindkét oldalához ugyanazt a számot hozzáadjuk, vagy az egyenlet mindkét oldalát ugyanazzal a nullától különböző számmal megszorozzuk.  4.3  Másodfokú egyenletek  Másodfokú egyenlet, vagy kvadratikus egyenlet alatt olyan (53) alakú egyenletet értünk, melynél F és G másodfokú polinomok. Mivel ezek értelmezési tartománya egyaránt a valós számok halmaza, ı́gy egy másodfokú egyenlettel kapcsolatban  ha mást nem mondunk  az egyenlet értelmezési tartománya alatt a valós számok halmazát fogjuk érteni. Figyelembe véve a másodfokú polinomok 3.9 pontban megadott általános alakját, minden másodfokú egyenlet a x2 + b x + c = 0  (62)  formában ı́rható fel, ahol a, b, c tetszőleges valós számok, és a 6= 0. Az egyenlet megoldáshalmaza az a, b és c értéketől függően megadható.
Szorozzuk be az (62) egyenlet mindkét oldalát 4a-val, ekkor a következőt kapjuk: 4a2 x2 + 4ab x + 4ac = (2ax + b)2 + 4ac − b2 = 0 , (63) amiből (2ax + b)2 = b2 − 4ac adódik. Ebből látható, hogy az egyenletnek akkor és csak akkor létezik megoldása, ha a jobb oldalon álló d = b2 −4ac szám, amit az egyenlet diszkriminánsának nevezünk, nem negatı́v. Ha d = 0, akkor az egyetlen megoldás x=−  b 2a     134  Egyenletek, egyenlőtlenségek  ha pedig d > 0, akkor két megoldás van: √ −b + b2 − 4ac , x1 = 2a és  √ b2 − 4ac . x2 = 2a Ezeket a megoldásokat egyetlen képletben, a másodfokú egyenlet megoldóképletében szoktuk egyesı́teni: √ −b ± b2 − 4ac . (64) x1,2 = 2a −b −  A d = 0 esetben tehát x1 = x2 . A (63) lépésben végrehajtott átalakı́tás az úgynevezett teljes négyzetté egészı́tés. Könnyű látni, hogy a fenti x1 , x2 gyökökkel fennáll az a x2 + b x + c = a(x −
x1 )(x − x2 )  (65)  azonosság, amelyből az x két oldalon szereplő együtthatóinak összehasonlı́tása révén az c b (66) x1 · x2 = x1 + x2 = − , a a egyenlőségeket kapjuk, amelyek az úgynevezett gyökök és együtthatók közti összefüggések. A (65) egyenlőség azt mutatja, hogy ha egy másodfokú polinom diszkriminánsa nem negatı́v, akkor a polinom felı́rható két elsőfokú polinom szorzataként, mely polinomok azonosak, ha a diszkrimináns nulla, és különbözők, ha a diszkrimináns pozitı́v. A (65) felı́rást a másodfokú polinom, illetve egyenlet gyöktényezős alakjának nevezzük. Ha két különböző gyök létezik, akkor azt mondjuk, hogy ezek egyszeres gyökök, illetve azt, hogy ezeknek a gyököknek a multiplicitása 1, mı́g ha egyetlen gyök van, azt úgy foghatjuk fel, hogy a két gyök egybeesik, egy kétszeres gyököt kapunk, melynek multiplicitása tehát 2. Ez
a terminológia azért hasznos, mert használatával a következő tételt fogalmazhatjuk meg. 4.31 Tétel Egy másodfokú egyenletnek vagy nincs valós gyöke, vagy  multiplicitással együtt  két valós gyöke van attól függően, hogy az egyenlet diszkriminánsa negatı́v, vagy nem negatı́v Az utóbbi esetben a gyököket a (64) formula szolgáltatja. Megjegyezzük, hogy a (66) formulák arra is alkalmasak, hogy segı́tségükkel megadott gyökökkel rendelkező másodfokú egyenleteket ı́rhatunk fel. Összefoglalva, a másodfokú egyenletek megoldáshalmazáról azt mondhatjuk, hogy az vagy az üres halmaz, vagy egy egypontos halmaz, vagy egy kétpontos halmaz, attól függően, hogy az egyenlet diszkriminánsa negatı́v, nulla, vagy pozitı́v.     4.4 Magasabbfokú egyenletek  4.4  135  Magasabbfokú egyenletek  Az első- és másodfokú egyenletek mintájára természetesen magasabbfokú egyenleteket is
vizsgálhatunk, amelyek általános alakja P (x) = Q(x) , illetve, nullára redukált formában P (x) = 0 ,  (67)  ahol P, Q legalább első fokú polinomok. A (67) egyenletet algebrai egyenletnek is szokás nevezni. A (67) algebrai egyenlet megoldása tehát egyet jelent a P polinom összes zérushelyeinek meghatározásával. Korábban már megjegyeztük, hogy egy polinomnak legfeljebb annyi zérushelye lehet, amennyi a fokszáma, de nyilván az is előfordulhat, hogy egy legalább elsőfokú polinomnak egyetlen zérushelye sincs. Ilyen eset például az, amikor egy másodfokú polinom diszkriminánsa negatı́v Azt is emlı́tettük, hogy páratlan fokszámú polinomoknak mindig van zérushelye A polinomok zérushelyeivel kapcsolatos egyik legfontosabb eredmény az algebra alaptétele, amely a következőképpen fogalmazható. 4.41 Tétel (Az algebra alaptétele) Minden legalább elsőfokú polinom felı́rható első- és
másodfokú polinomok hatványainak szorzataként úgy, hogy az elsőfokú tényezőkhöz tartozó hatványkitevőknek és a másodfokú tényezőkhöz tartozó hatványkitevőknek az összege megegyezik a polinom fokszámával. A tétel bizonyı́tása mély eszközöket igényel. A tétel állı́tása a következőt jelenti Legyen P legalább elsőfokú polinom, melynek fokszáma n, főegyütthatója an . Ekkor P felı́rható P (x) = an (x − x1 )α1 .   (x − xk )αk · (x2 + b1 x + c1 )β1    (x2 + bl x + cl )βl (68) alakban, ahol k, l természetes számok, melyekre k+2l = n teljesül, α1 , α2 , .   , αk és β1 , β2 , .   , βl pozitı́v egész számok, továbbá x1 , x2 ,    , xk , b1 , b2 ,    , bl valamint c1 , c2 ,    , cl valós számok, melyekre b2i − 4ci < 0  (69)  teljesül i = 1, 2, .   , l esetén Ha még azt is feltételezzük, hogy az x1 , x2 ,    , xk számok különbözők, s az előbbi
felı́rásban szereplő másodfokú polinomok is páronként különbözők, akkor ez a felı́rás a tényezők sorrendjétől eltekintve egyértelmű. Látható, hogy a (65) alak ennek speciális esete, ı́gy a (68) előállı́tást tekinthetjük a P polinom gyöktényezős alakjának Ennek az a magyarázata, hogy az elsőfokú tényezőkben szereplő x1 , x2 , .   , xk számok a P polinom összes zérushelyei, hiszen a másodfokú tényezőknek a (69) feltétel miatt nincs gyökük, azok már nem bonthatók fel két lineáris tényező szorzatára. Az αj számot itt is az xj gyök multiplicitásának nevezzük. Természetesen az is előfordulhat, hogy a k, l számok valamelyike nulla, s ekkor a megfelelő gyöktényezők a felı́rásból hiányoznak.     136  Egyenletek, egyenlőtlenségek  Mivel az (68) alak a P polinomot bizonyos értelemben teljesen leı́rja, ı́gy segı́tségével a (67) egyenlet
összes megoldását megkapjuk. Azonban a (68) alak meghatározása valójában éppen a (67) egyenlet megoldása révén lehetséges, például úgy, ahogy azt az első- és másodfokú egyenletek esetében láttuk. Bár a harmadfokú és a negyedfokú polinomok, illetve egyenletek esetében vannak olyan képletek, amelyek a (64) formulához hasonlóan lehetővé teszik, hogy az egyenlet összes megoldásait a polinom együtthatóiból kiszámı́tsuk, ám meg lehet mutatni, hogy ez negyedfokúnál magasabb fokú egyenletek esetében már nem ı́gy van: semmilyen négynél nagyobb n esetén nincs olyan algebrai formula, amely a négy alapművelet és gyökvonások segı́tségével lehetővé tenné, hogy akármilyen n-edfokú polinom összes gyökeit kiszámı́thassuk a polinom együtthatóiból. Mint emlı́tettük, a harmad- és negyedfokú egyenletek esetében ismert ugyan ilyen formula, de azok bonyolultsága
miatt gyakorlati használhatóságuk csekély. Így általános módszer hı́ján csak néhány speciális esetben tudjuk a másodfokúnál magasabb fokú egyenletek összes megoldását meghatározni. Ezzel kapcsolatban néhány általános megjegyzést tehetünk. Mindenekelőtt látható, hogy ha x0 a P polinomnak gyöke, akkor a P polinom osztható az x − x0 polinommal. Tehát ha a (67) egyenletnek valamilyen úton-módon megtaláltuk egy x0 megoldását, akkor a P polinomot a jól ismert polinomosztási algoritmus segı́tségével eloszthatjuk az x − x0 polinommal, s ezáltal a (67) egyenlet fokszámát eggyel csökkenthetjük. Egész együtthatós egyenletek racionális gyökeinek meghatározásához nyújt segı́tséget a következő tétel. 4.42 Tétel Legyen P a következő egész együtthatós polinom: P (x) = an xn + an−1 xn−1 + · · · + a1 x + a0 , ahol tehát a0 , a1 , .   , an egész számok
és an 6= 0 Ha pq egy racionális szám, melynél p, q nullától különböző, relatı́v prı́m egész számok, és P ( pq ) = 0, akkor p az a0 -nak, q pedig az an -nek osztója. Bizonyı́tás. Behelyettesı́tés és q n -el való szorzás után az an pn = −an−1 pn−1 q − · · · − a1 pq n−1 − a0 q n egyenlőséget kapjuk, melynek jobb oldalán q-val osztható szám áll, ı́gy an pn osztható q-val, ami p és q relatı́v prı́m volta miatt csak úgy lehetséges, ha an osztható q-val. Hasonlóan kapjuk, hogy a0 osztható p-vel Megjegyezzük, hogy ugyanezzel a módszerrel racionális együtthatós algebrai egyenlet racionális gyökeit is meghatározhatjuk, ugyanis az egyenletet beszorozva a racionális együtthatók szorzatával egy egész együtthatós egyenletet kapunk, amely az előbbivel ekvivalens. További speciális esetekben ugyancsak lehetőség van az egyenlet fokszámának csökkentésére új
változó bevezetésével. Ha az egyenlet fokszáma n = 2k     4.4 Magasabbfokú egyenletek  137  páros szám, melyben csak a konstans tag, valamint az xk és x2k együtthatója különbözik nullától, akkor az egyenlet az y = xk helyettesı́téssel másodfokú egyenletre vezethető vissza, melyet megoldva k-adik gyökvonás után az eredeti egyenlet gyökeit kapjuk. Az algebrai egyenletek megoldáshalmazának a 4.1 szakasz értelmében vett meghatározására nincs általános módszer. Egy biztos: egy ilyen egyenlet megoldáshalmaza legfeljebb annyi pontból áll, amennyi az egyenlet fokszáma, ezen belül azonban bármilyen lehetőség előfordulhat. Lássunk néhány egyszerű példát a fentiek alkalmazására! Első egyenletünk x8 − 17 · x4 + 16 = 0 . Legyen y = x4 , ekkor az egyenlet az y 2 − 17 y + 16 = 0 alakot ölti, tehát másodfokú, melynek megoldásai y1 = 16 és y2 = 1. Az első esetben a 16 = x4
egyenletből x = ±2 adódik, mı́g a második esetben az 1 = x4 egyenletből x = ±1. Így az összes megoldás nagyság szerint rendezve x1 = −2, x2 = −1, x3 = 1 és x4 = 2. Visszahelyettesı́tés mutatja, hogy ezek valóban megoldások. A következő példában próbáljuk meg megoldani a 21 x3 − 53 x2 + 20 x + 4 = 0 harmadfokú egyenletet. Először az egyenlet racionális gyökeit fogjuk meghatározni Ha a pq racionális szám az egyenletnek megoldása, továbbá p, q nullától különböző, relatı́v prı́m egész számok, akkor a 4.42 tétel szerint p a 4-nek, q pedig a 21-nek osztója. Az előbbiek a ±1, ±2 és ±4 számok, mı́g az utóbbiak ±1, ±3, ±7 és ±21. A lehetséges pq számok tehát a következők: 1 1 1 ±1, ± , ± , ± , 3 7 21 2 2 2 ±2, ± , ± , ± , 3 7 21 valamint  4 4 4 ±4, ± , ± , ± . 3 7 21 Ezeket sorra behelyettesı́tve az egyenletbe először az x1 = − 71 értékről derül
ki, hogy valóban gyök. Ha akarjuk, ugyanı́gy folytathatjuk a keresést, de egy gyök ismeretében az egyenletet másodfokú egyenletre redukálhatjuk, ha az eredeti polinomot elosztjuk az x1 gyöknek megfelelő x + 71 gyöktényezővel. Elvégezve a polinomok osztását azt kapjuk, hogy 1 21 x3 − 53 x2 + 20 x + 4 = (x + ) · (21 x2 − 56 x + 28) , 7     138  Egyenletek, egyenlőtlenségek  ı́gy már csak a  21 x2 − 56 x + 28 = 0  egyenletet, vagy ami ugyanaz, a 3 x2 − 8 x + 4 = 0 egyenletet kell megoldanunk, melyre a másodfokú egyenlet megoldóképletéből az x2 = 2 és x3 = 32 gyököket kapjuk. Visszahelyettesı́téssel ellenőrizhetjük, hogy ezek valóban gyökök, s mivel az egyenlet harmadfokú, ı́gy több gyök biztosan nem létezik.  4.5  Abszolút értékkel kapcsolatos egyenletek  Az abszolút értékkel kapcsolatos egyenletek általában |F1 (x)| + |F2 (x)| + · · · + |Fk (x)| = |G1 (x)| + |G2 (x)| + · · ·
+ |Gl (x)|  (70)  alakúak, ahol F1 , F2 , .   , Fk , G1 , G2 ,    , Gl valamilyen adott valós függvények, melyek értelmezési tartományának közös része a (70) egyenlet értelmezési tartománya. Természetesen ebben az általánosságban a (70) egyenlet megoldásairól nem sokat mondhatunk. Az abszolútérték-függvény tulajdonságai alapján azért néhány általános megjegyzést tehetünk a lehetséges megoldási módszerekkel kapcsolatban. Abban az esetben, ha az egyenlet |F (x)| = 0 speciális alakú, akkor ez az egyenlet nyilván ekvivalens az F (x) = 0 egyenlettel, ı́gy az abszolút érték jele egyszerűen elhagyható. Hasonló a helyzet akkor is, ha egyenletünk alakja |F1 (x)| + |F2 (x)| + · · · + |Fk (x)| = 0 , ekkor ugyanis nyilván minden tagnak mullával kell egyenlőnek lennie, azaz, az Fi (x) = 0 egyenleteknek i = 1, 2, .   , k esetén egyidejűleg teljesülnie kell, ı́gy az eredeti egyenlet
megoldáshalmaza megegyezik ezen egyenletek megoldáshalmazainak közös részével. Ha az egyenlet |F (x)| = |G(x)| alakú, akkor két egyenletet kell megoldanunk, mégpedig az F (x) = G(x) ,     4.5 Abszolút értékkel kapcsolatos egyenletek  139  illetve F (x) = −G(x) egyenleteket, hiszen két valós szám abszolút értéke akkor és csak akkor egyenlő, ha a két szám egyenlő, vagy egymás negatı́vja. Ilyenkor az eredeti egyenlet megoldáshalmaza a kapott két egyenlet megoldáshalmazainak egyesı́tése. Vizsgáljuk meg most, hogy mit tehetünk azokban az esetekben, amikor a (70) egyenlet mindkét oldalán vannak nullától különböző tagok, s legalább az egyik oldalon legalább két tag szerepel, vagyis k, l ≥ 1 és k + l ≥ 3. A legegyszerűbb eset jól illusztrálja a lehetőségeket. Legyen egyenletünk a következő: |F (x)| + |G(x)| = |H(x)| ,  (71)  ahol F, G, H adott valós függvények, melyek
értelmezési tartományainak közös része az egyenlet értelmezési tartománya. A (71) egyenlet valójában az F (x) ± G(x) = ±H(x) egyenletek valamelyikét jelenti, különböző értelmezési tartományokon. Pédául, azon a halmazon, amelyen F nem negatı́v, G negatı́v, a H függvény pedig ugyancsak negatı́v értékeket vesz fel, a (70) egyenlet az F (x) − G(x) = −H(x) egyenletet jelenti. Tehát a (71), s általánosabban a (70) egyenletek megoldásának problémáját a lehetséges esetek szétválasztásával tudjuk visszavezetni abszolút értéket már nem tartalmazó egyenletek vizsgálatára Ez azt jelenti, hogy az egyenlet értelmezési tartományát olyan diszjunkt részhalmazokra igyekszünk felbontani, melyek mindegyikén az F1 , F2 , .   , Fk , G1 , G2 ,    , Gl függvények állandó előjelűek, hiszen ekkor az illető részhalmazokon az abszolút érték jele a + vagy − előjelek
valamelyikével helyettesı́thető. Kérdés, hogy ezt a felbontást hogyan lehet a legcélszerűbb módon elvégezni Nos, először is meg kell határoznunk az összes F1 , F2 , .   , Fk , G1 , G2 ,    , Gl függvények zérushelyeit Szerencsés esetben ezek egy véges halmazt alkotnak, s ilyenkor ennek a véges halmaznak a pontjai a valós számok halmazát véges sok páronként diszjunkt intervallumra bontják fel. Ezeken az intervallumokon a F1 , F2 ,    , Fk , G1 , G2 ,    , Gl függvények mindegyike állandó előjelű, ı́gy az abszolút érték jelek az egyenletből alkalmas módon kiküszöbölhetők. Lássunk erre az eljárásra egy konkrét példát! Tekintsük az |3x − 9| + |2 x2 − 12 x + 10| = |2 x + 8| (72) egyenletet, melynek értelmezési tartománya a valós számok halmaza. Az előbb mondottak alapján először oldjuk meg a 3x − 9 = 0 ,  (73)  2 x2 − 12 x + 10 = 0  (74)     140  Egyenletek,
egyenlőtlenségek  és 2x + 8 = 0  (75)  egyenleteket. Ezek megoldásai nagyság szerint rendezve az x1 = −4, x2 = 1, x3 = 3 és x4 = 5 számok. Ezek után a ]−∞, −4] intervallumon (72) a következőt jelenti: −(3x − 9) + (2 x2 − 12 x + 10) = −(2 x + 8) , ami a 2 x2 − 13 x + 27 = 0 másodfokú egyenlettel ekvivalens. Ennek az egyenletnek a diszkriminánsa negatı́v, ı́gy nincs megoldása Ez tehát azt jelenti, hogy eredeti egyenletünk megoldáshalmaza a ] − ∞, −4] intervallumtól diszjunkt, ezen a szakaszon az egyenletnek nincs megoldása A következő intervallum a ] − 4, 1] szakasz, ezen (72) a következőt jelenti: (3x − 9) + (2 x2 − 12 x + 10) = −(2 x + 8) , ami a 2 x2 − 7 x + 9 = 0 másodfokú egyenlettel ekvivalens, melynek diszkriminánsa ugyancsak negatı́v, tehát a ] − 4, 1] szakaszon sincs megoldás. Következik az ]1, 3] intervallum, melyen egyenletünk alakja: (3x − 9) − (2 x2 − 12 x + 10) =
−(2 x + 8) , s ez a 2 x2 − 17 x + 11 = 0 másodfokú egyenlettel ekvivalens. Ennek gyökei a √ √ 17 − 201 17 + 201 és 4 4 számok, ám ezek egyike se esik az ]1, 3] intervallumba, ı́gy ebben az esetben sem kapunk megoldást. A következő szakasz a ]3, 5] intervallum, melyen egyenletünk a következő alakú: (3x − 9) − (2 x2 − 12 x + 10) = 2 x + 8 , s ez a 2 x2 − 17 x + 11 = 0 másodfokú egyenlettel ekvivalens, melynek ismét nincs megoldása, hiszen diszkriminánsa negatı́v.     Gyökös egyenletek  141  Végül az ]5, +∞[ intervallumon az eredeti egyenlet alakja (3x − 9) + (2 x2 − 12 x + 10) = 2 x + 8 , s ez a  2 x2 − 11 x − 7 = 0  másodfokú egyenlettel ekvivalens, melynek megoldásai a √ √ 11 − 177 11 + 177 és 4 4 számok. Ezek közül a második nem esik az ]5, +∞[ intervallumba, de az első igen, ı́gy a (72) egyenlet egyetlen megoldása √ 11 + 177 , x= 4 melynek helyességét
visszahelyettesı́téssel ellenőrizhetjük.  4.6  Gyökös egyenletek  Az alkalmazásokban előforduló egyenletek következő tı́pusához olyan egyenletek tartoznak, amelyekben különböző gyökös kifejezések fordulnak elő. Ez nyilván csak akkor jelent az eddigiektől eltérő nehézséget, ha az ismeretlen is előfordul ilyen gyök alatti kifejezésekben. Természetesen általános ”csodaszert” az ilyen egyenletekkel kapcsolatban sem remélhetünk, még az ilyen egyenletek legáltalánosabb alakját sem kı́sérelhetjük meg felı́rni, ám ehelyett lássunk néhány tipikus esetet. A legegyszerűbb eset az, amikor egyenletünk p n F (x) = b alakú, ahol F egy adott valós függvény, n ≥ 2 egész szám, b pedig adott valós szám. Az egyenlet értelmezési tartománya az F értelmezési tartományának az a része, amelyen az F értékei beletartoznak az n-edik gyök függvény értelmezési
tartományába, ami páros n esetén a nem negatı́v valós számok, páratlan n esetén pedig az összes valós számok halmaza. Az egyenlet mindkét oldalát nedik hatványra emelve sikerül kiküszöbölnünk az n-edik gyököt: F (x) = bn , ı́gy már csak ezzel az egyenlettel kell foglalkoznunk. Hasonlóan járhatunk el az p p n F (x) = n G(x) egyenlet esetében, n-edik hatványra emelés után az F (x) = G(x)     142  Egyenletek, egyenlőtlenségek  egyenletet kapjuk. Ha az iménti egyenletben különböző gyökkitevők szerepelnek, tehát alakja p p n F (x) = m G(x) , ahol m, n ≥ 2 egész számok, akkor az egyenlet mindkét oldalát m · n-edik hatványra kell emelni, hogy az F (x)m = G(x)n egyenletet kapjuk. Lényegesen bonyolultabb az az eset, amikor az egyenlet valamelyik oldalán egynél több gyökös kifejezés szerepel, s közben a másik oldalon is van legalább egy ilyen. Lássunk egy egyszerű példát,
amelyben csak négyzetgyökök szerepelnek √ √ √ 6x − 5 − 3x + 1 = x − 4. Először emeljük mindkét oldalt négyzetre, ekkor a következőt kapjuk: 6x − 5 − 2 ·  √ √ 6x − 5 · 3x + 1 + 3x + 1 = x − 4.  Az egyenletet a következő módon rendezzük: 4x =  p 18 x2 − 9 x − 5 ,  majd ismét négyzetre emeljük mindkét oldalt: 16 x2 = 18 x2 − 9 x − 5 , ami a következő másodfokú egyenletre vezet: 2 x2 − 9 x − 5 = 0 , melynek megoldásai x1 = 5 és x2 = − 21 . Visszahelyettesı́téssel meggyőződhetünk arról, hogy x1 valóban megoldás, ám x2 nem tartozik hozzá az eredeti egyenlet értelmezési tartományához, hiszen mindhárom négyzetgyök alá negatı́v szám kerül. Így az egyetlen megoldás: x = 5 Ebből az egyszerű példából látható, hogy az ilyen egyenletek megoldása során számos nehézséggel kell számolnunk. Ha több gyökös kifejezés van az egyenletben,
akkor általában igyekezzünk a tagokat úgy rendezni, hogy az egyik oldalon csak egyetlen gyökös kifejezés maradjon, majd ezután hatványozzunk. Persze, ha nem csak négyzetgyökök fordulnak elő, hanem magasabb gyökkitevők is, akkor ez jelentősen elbonyolı́thatja a számı́tásokat. Mint emlı́tettük, általános módszer nincs, az egyenlet konkrét alakjától függően kell különböző ötletekkel próbálkoznunk.     4.7 Exponenciális egyenletek  4.7  143  Exponenciális egyenletek  Az exponenciális egyenleteknek az a sajátossága, hogy az egyenletben az ismeretlen valamilyen exponenciális kifejezés kitevőjében szerepel. A legegyszerűbb exponenciális egyenlet aF (x) = b , (76) ahol F valamilyen adott valós függvény, a, b pedig adott valós számok, melyekről általában feltételezhetjük, hogy pozitı́vak. Az a 6= 1 esetben ennek az alapegyenletnek a megoldása úgy történik, hogy mindkét
oldalnak vesszük az a alapú logaritmusát, s a következőt kapjuk: F (x) = loga b , tehát az egyenletet ”megszabadı́tottuk” az exponenciális problémától. Ha a = 1, akkor két eset lehetséges: a b = 1 esetben minden olyan valós szám megoldás, amely az F értelmezési tartományához tartozik, mı́g a b 6= 1 esetben az egyenletnek nincs megoldása. Egy másik ilyen alaptı́pus a következő: aF (x) = aG(x) ,  (77)  ahol F, G adott valós függvények, a pedig pozitı́v valós szám. Ha a = 1, akkor minden olyan valós szám megoldás, amely benne van az F és G függvények értelmezési tartományainak közös részében. Ha viszont a 6= 1, akkor a fenti módszert alkalmazzuk: mindkét oldal a alapú logaritmusát véve az F (x) = G(x) egyenlethez jutunk. Valójában a (77) egyenlet visszavezethető (76)-ra, ugyanis mindkét oldalt a−G(x) -szel megszorozva az aF (x)−G(x) = 1 egyenletet kapjuk, s ez már (76)
tı́pusú. Ám ez fordı́tva is igaz: a (76) egyenlet ı́gy is felı́rható: aF (x) = aloga b , ami a G(x) = loga b konstans függvénnyel (77) tı́pusú. Tehát az a 6= 1 esetben a (76) és (77) egyenleteket tekinthetjük az exponenciális egyenletek alaptı́pusainak, minden további exponenciális egyenletet ezek valamelyikére igyekszünk visszavezetni. A visszavezetés módja természetesen döntő mértékben függ az egyenlet speciális alakjától, ı́gy általános módszereket nem várhatunk. Mindenesetre lássunk néhány egyszerű példát: √ 5 8 · 4x = 16 . Az egyenletben 2 különböző hatványai szerepelnek, s ı́gy ı́rható: 4  23 · 22 x = 2 5 ,     144  Egyenletek, egyenlőtlenségek  azaz  4  23+2 x = 2 5 .  Ez tehát már a (76) alaptı́pus, s mindkét oldal 2-es alapú logaritmusát véve 3 + 2x =  4 5  11 . Visszahelyettesı́téssel meggyőződhetünk a megoldás adódik, amiből x = − 10
helyességéről.  A következő példa  1  9x+ 2 − 28 · 3x + 9 = 0 .  Látható, hogy az exponenciális tagok 3 hatványai, ı́gy az egyenletet a következő módon ı́rjuk át: 3 · 9x − 28 · 3x + 9 = 0 , vagy ami ugyanaz  3 · (3x )2 − 28 · 3x + 9 = 0 .  Ez az egyenlet az y = 3x helyettesı́téssel az y változóra nézve másodfokú: 3 y 2 − 28 y + 9 = 0 , amelynek megoldásai y1 = 9 és y2 = 31 . Az első esetben a 3x = 9 egyenletet, a másodikban pedig az 3x =  1 3  egyenletet kell megoldanunk, amelyekből a fenti módszerrel kapjuk, hogy x1 = 2 és x2 = −1. Visszahelyettesı́téssel ellenőrizhetjük, hogy mindkettő megoldás  4.8  Logaritmusos egyenletek  A ”logaritmusos egyenlet” kifejezés olyan egyenleteket takar, amelyekben az ismeretlen valamilyen logaritmus változójában szerepel. A legegyszerűbb logaritmusos egyenlet loga F (x) = loga G(x) , (78) ahol F, G valamilyen adott valós függvények, a > 0
pedig pozitı́v szám és a 6= 1. Az egyenlet értelmezési tartománya az F és G függvények értelmezési tartományai metszetének az a része, amelyen mind az F , mind a G pozitı́v értékeket vesznek fel. Az egyenlet mindkét oldalára a loga függvény inverzét, az a alapú exponenciális függvényt alkalmazva az F (x) = G(x)     4.8 Logaritmusos egyenletek  145  egyenletet kapjuk, tehát a logaritmust sikerült ”kiküszöbölni”. Az egyenlet következő változata loga F (x) = logb G(x) , (79) ahol F, G valamilyen adott valós függvények, a, b > 0 pozitı́v számok és a, b 6= 1. A 2.133 tétel utolsó állı́tása, a különböző alapú logaritmusok közti átszámı́tási szabály szerint logb G(x) = loga G(x) · logb a , ı́gy a (79) egyenlet a következővel ekvivalens: loga F (x) = loga G(x) · logb a = loga G(x)logb a ,  (80)  ami már (78) alakú. Természetesen vannak olyan logaritmusos
egyenletek, amelyek (78)-nál lényegesen bonyolultabbak, s meg sem kı́sérelhetjük az ilyenek tárgyalását teljes általánosságban. Röviden azt lehet mondani, hogy az ilyen egyenleteket valamilyen módon, a logaritmus és az exponenciális függvény tulajdonságai segı́tségével megpróbáljuk a (78) egyenletre visszavezetni. Tekintsük például a következő egyenletet: α1 · loga F1 (x) + · · · + αm · loga Fm (x) = β1 · loga G1 (x) + · · · + βn · loga Gn (x) , ahol m, n természetes számok, m + n ≥ 1, α1 , .   , αm és β1 ,    , βn nullától különböző valós számok, a 6= 1 pozitı́v valós szám, F1 , .   , Fm , G1 ,    , Gn pedig adott valós függvények. Ez az egyenlet annyival lehetne általánosabb, hogy az a szám helyett az összes logaritmusok alapjai különbözők lehetnének, ám az imént láttuk, hogy az az eset könnyen visszavezethető erre. Nos, a logaritmus azonosságait
figyelembe véve az előbbi egyenlet a következővel ekvivalens: F1 (x)α1 · F2 (x)α2 .   Fm (x)αm = G1 (x)β1 · G2 (x)β2    Gn (x)βn , s ez már (78) alakú. Tekintsünk ezek után egy egyszerű példát: lg(x + 3) − lg(x − 4) = lg 2 + lg(x − 1) . A logaritmus azonosságainak felhasználásával ez a következővel ekvivalens: lg  x+3 = lg 2(x − 1) , x−4  azaz  x+3 = 2(x − 1) . x−4 Ebből a következő másodfokú egyenletet kapjuk: 2 x2 − 11 x + 5 = 0 ,     146  Egyenletek, egyenlőtlenségek  amelynek megoldásai x1 = 5 és x2 = 21 . Látható, hogy x2 nem tartozik az egyenlet értelmezési tartományához, hiszen az x 7 lg(x − 4) függvény nincs értelmezve az 21 pontban, viszont az x1 = 5 valóban megoldás, ı́gy az egyenlet egyetlen megoldása x = 5. Egy másik egyszerű példa a következő: lg(3 x − 5) − lg(5 x − 3) − lg(3 − 5 x) = lg(3 x + 5) . Mivel az egyenlet értelmezési tartománya
része az x 7 lg(3 x − 5) és az x 7 lg(3 − 5 x) függvények értelmezései tartományai metszetének, ı́gy az egyenlet értelmezési tartományának minden x elemére a 3 x − 5 > 0 és 3 − 5 x > 0 egyenlőtlenségeknek kell teljesülni, s ez azt jelenti, hogy x < 53 és x > 35 , ı́gy az egyenlet értelmezési tartománya az üres halmaz: az egyenletnek nincs megoldása.  4.9  Trigonometrikus egyenletek  A trigonometrikus egyenletekkel kapcsolatban hasonló megállapı́tásokat tehetünk, mint korábban az exponenciális, illetve a logaritmusos egyenletek esetében. Az ilyen egyenletekre az a jellemző, hogy az ismeretlen valamilyen trigonometrikus függvény változójában lép fel Nagy különbség azonban az eddig tárgyalt egyenlet-tı́pusokhoz képest, hogy a trigonometrikus függvények periodicitása miatt az inverz trigonometrikus függvényeket csak körültekintően lehet alkalmazni az egyenlet
megoldása során. Túlságosan általános megoldási módszereket a trigonometrikus egyenletekkel kapcsolatban sem tudunk ismertetni, de néhány általános megjegyzést tehetünk, illetve speciális esetekben hasznos ismereteket nyújthatunk. Jelölje trig a cos, sin, tan, illetve cot függvények bármelyikét. A legegyszerűbb trigonometrikus egyenlet trig F (x) = c  (81)  alakú, ahol F adott valós függvény, melynek értékkészlete természetesen részhalmaza a trig függvény értelmezési tartományának, c pedig valós szám. Ennek az egyenletnek nyilván csak akkor van megoldása, ha a c szám benne van a trig függvény értékkészletében. Ha ez teljesül, akkor a megfelelő inverz trigonometrikus függvény alkalmazásával kapunk egy megoldást, majd ezt, és az illető trigonometrikus függvény periodicitási tulajdonságát felhasználva meg tudjuk adni az egyenlet összes megoldását. Tekintsük
például a következő egyenletet: ¡ π¢ 1 = cos x2 − 3 x + 2 + 3 2 egyenletet. Ha az egyenlet mindkét oldalára alkalmazzuk az arccos függvényt, akkor π 1 π x2 − 3 x + 2 + = arccos = 3 2 3     4.9 Trigonometrikus egyenletek  147  adódik, hiszen a [0, π] intervallumban az egyetlen valós szám, amelynek koszinusza 21 , éppen π3 . Ám ezzel csak azokat a valós számokat kaptuk meg, amelyeknek koszinusza 21 , és a [0, π] intervallumba esnek, holott az egyenlet szerint minket az összes olyan valós szám éredekel, amelynek koszinusza 21 . Ez azt jelenti, hogy az arccos függvény alkalmazásával kapott egyenlet valójában nem következménye az eredetinek, csak akkor, ha az x a [0, π] intervallumhoz tartozik, akkor viszont ekvivalens vele. Így az eredeti egyenletből akkor tudjuk a helyes következtetést levonni, ha  figyelembe véve a cos függvény 2π szerinti periodicitását és páros voltát  azt ı́rjuk, hogy az
eredeti egyenletből x2 − 3 x + 2 +  π π = ± + 2kπ 3 3  következik valamilyen k egész számmal. Ebből a végtelen sok lehetőségből a π3 az egyetlen, ami a [0, π] intervallumba esik, ezt adja az arccos függvény. Ám ez még csak egy fél periódus, s valóban, a cos függvény párossága miatt − π3 ugyancsak szóbajön, s ezzel a [−π, π] intervallumon, ami egy teljes periódus, minden lehetőséget figyelembe vettünk. Természetesen ugyanez megismétlődhet minden periódusban, ı́gy mindkét esetben a most kapott számokhoz még hozzá kell adni a periódus egész számú többszöröseit. A fenti egyenlőség tehát valójában végtelen sok másodfokú egyenletet jelent, melyek megoldáshalmazainak egyesı́tése lesz eredeti egyenletünk megoldáshalmaza. Így például k = 0 esetén az egyenletben a + előjelet véve figyelembe a kapott másodfokú egyenlet megoldásai x1 = 1 és x2 = 2,
melyekről az eredeti egyenletbe való visszahelyettesı́téssel ellenőrizhetjük, hogy valóban megoldások. Az általános esetben egyenletünk két változata a +, illetve − előjelek választásának megfelelően: x2 − 3 x + 2 + 2 k π = 0 ,  (82)  illetve  2π + 2kπ = 0, (83) 3 ahol k tetszőleges egész szám. A másodfokú egyenlet megoldóképlete alapján az első esetben √ 3 ± 1 − 8 kπ , x1,2 = 2 amely csak akkor ad megoldást, ha k = 0, vagy k negatı́v egész szám, s viszszahelyettesı́tés mutatja, hogy ezek valóban megoldások. A második esetben a megoldóképlet az q x2 − 3 x + 2 +  x3,4 =  3±  1 − 8π 3 − 8 kπ  2 lehetséges megoldásokat szolgáltatja, melyek pontosan akkor megoldások, ha k negatı́v egész szám. Ezzel az eredeti egyenletet teljes egészében megoldottuk     148  Egyenletek, egyenlőtlenségek A (81) egyenletnél valamivel bonyolultabb a következő alaptı́pus: trig F (x) =
trig G(x) ,  (84)  ahol F és G adott valós függvények, melyek értékkészlete részhalmaza a trig függvény értelmezési tartományának. A (84) egyenlet természetes értelmezési tartománya tehát az F és G függvények értelmezési tartományai metszetének az a részhalmaza, melyen az F és G értékei egyaránt a trig függvény értelmezési tartományába esnek. A (84) egyenletből természetesen nem következik az, hogy F (x) = G(x), hiszen a trig függvény még egy perióduson belül is többször felveheti ugyanazt az értéket. Az ilyen egyenleteknél a trig trigonometrikus függvény kiküszöböléséhez különböző módszereket alkalmazhatunk. Például, a sin F (x) = sin G(x) egyenlet ekvivalens a sin F (x) − sin G(x) = 0 egyenlettel, ami a trigonometrikus összefüggések alapján a következő módon szorzattá alakı́tható: sin F (x) − sin G(x) = 2 · cos  F (x) − G(x) F (x)
+ G(x) · sin , 2 2  ı́gy eredeti egyenletünk ekvivalens a következővel: cos  F (x) − G(x) F (x) + G(x) · sin = 0, 2 2  amiből cos  F (x) + G(x) = 0, 2  sin  F (x) − G(x) =0 2  vagy  következik. Az első esetben π F (x) + G(x) = ± + 2 kπ , 2 2 tehát F (x) + G(x) = ±π + 4 kπ  (85)  adódik, mı́g a második esetben F (x) − G(x) = kπ , 2 tehát F (x) − G(x) = 2 kπ  (86)     4.9 Trigonometrikus egyenletek  149  következik, ahol k tetszőleges egész szám. Az eredeti egyenlet megoldáshalmaza tehát a (85) és (86) egyenletek megoldáshalmazainak egyesı́tése. A trigonometrikus egyenletek harmadik alaptı́pusát az olyan egyenletek jelentik, amelyekben legalább két különböző trigonometrikus függvény lép fel, tehát a legegyszerűbb esetben trig 1 F (x) = trig 2 G(x) ,  (87)  ahol F , illetve G adott valós függvények, melyek értékkészlete részhalmaza a trig 1 , illetve trig 2 trigonometrikus függvények
értelmezési tartományának. Ilyenkor a különböző trigonometrikus függvényeket valamilyen módon ki kell fejeznünk egymással. Erre minden esetben van lehetőség A legegyszerűbbek a cos és sin, illetve a tan és cot közti következő összefüggések: sin x = − cos(x +  π 1 1 π ), cos x = − sin(x − ), cot x = , tan x = . 2 2 tan x cot x  Ezek mellett természetesen számos más lehetőség van arra, hogy a különböző trigonometrikus függvényeket egymással kifejezzük. Ilyen például a trigonometrikus Pithagorasz–tétel alapján a sin2 x = 1 − cos2 x összefüggés, valamint ebből következően tan2 x =  1 − 1. cos2 x  Ezeknek és hasonló összefüggéseknek a segı́tségével elérhetjük, hogy egy trigonometrikus egyenletben csak egyféle trigonometrikus függvény szerepeljen. Ezen túlmenően az egyenlet konkrét alakjától függően különböző egyedi eljárásokat kell
alkalmazni. Lássunk most egy egyszerű példát! Tekintsük a következő egyenletet: cos 2 x + 3 · sin x = 2 . Felhasználva a kétszeres szögekre vonatkozó összefüggést a koszinusz függvény esetében, azt kapjuk, hogy egyenletünk a következővel ekvivalens: cos2 x − sin2 x + 3 · sin x = 2 , illetve ami átrendezve a  1 − 2 · sin2 x + 3 · sin x = 2 , 2 · sin2 x − 3 · sin x + 1 = 0  alakot ölti. Az y = sin x helyettesı́téssel y-ra másodfokú egyenletet kapunk: 2 y2 − 3 y + 1 = 0 ,     150  Egyenletek, egyenlőtlenségek  melynek megoldásai y1 = 1 és y2 = 21 . Az első esetben sin x = 1, vagyis x = π2 + 2 kπ, a másodikban pedig sin x = 21 , amiből x = π6 + 2 kπ, vagy x = 5π 6 + 2 kπ következik, ahol k tetszőleges egész szám. Visszahelyettesı́téssel ellenőrizhetjük, hogy ezek mind megoldások. Még egy tı́pusról kell emlı́tést tennünk, amely a következő: a cos x + b sin x = c ,  (88) 
ahol a, b, c adott valós számok. Tételezzük fel, hogy a és b nullától különböző, hiszen ha valamelyik nulla, akkor az egyenletünk √ valamelyik korábban tárgyalt tı́pushoz tartozik. Az egyenletet elosztjuk a a2 + b2 kifejezéssel, ekkor √  b c a cos x + √ sin x = √ a2 + b2 a2 + b2 a2 + b2  adódik. Mivel √a2a+b2 és √a2b+b2 négyzetösszege 1, ı́gy létezik olyan α, melyre sin α = √  a  , cos α = √  a2 + b2  b a2 + b2  ,  tehát egyenletünk sin α · cos x + cos α · sin x = √  c a2 + b2  alakra hozható, s a sin addı́ciós tétele alapján ez ı́gy ı́rható: sin(α + x) = √  c a2 + b2  ,  ami a legelőször tárgyalt (81) tı́pusba tartozik. Például, tekintsük a következő egyenletet: √ cos x − 3 · sin x = 1 . √ Itt a = 1, b = − 3, ami azt jelenti, hogy az egyenletet elosztjuk 2-vel: √ 1 3 1 · cos x − · sin x = . 2 2 2 √  3 1 Legyen α = 5π 6 , ekkor sin α = 2 és cos α = − 2
, ı́gy egyenletünk  ¡ 5π ¢ 1 = sin x + 6 2 alakba ı́rható át, melynek megoldásai x=−  2π + 2 kπ , 3  és x = 2 kπ ,     Egyenlőtlenségek  151  ahol k tetszőleges egész szám. Könnyű ellenőrizni, hogy ezek valóban megoldások Természetesen a (88) egyenletek esetében alkalmazhatjuk a koszinusz függvény addı́ciós tételét is, illetve a szinusz, vagy a koszinusz függvény szubtrakciós tételét, ahogy kedvünk tartja.  4.10  Egyenlőtlenségek  A következőkben egyenlőtlenségek megoldásaival, megoldáshalmazaival fogunk foglalkozni. A 41 szakaszban elmondott általánosságok egyenletekre és egyenlőtlenségekre, sőt, ilyenekből képzett rendszerekre is érvényesek, ı́gy itt nem kı́vánunk ismétlésekbe bocsátkozni. Röviden csak annyit jegyzünk meg, hogy egy egyenlőtlenség ”megoldáshalmaza” alatt természetesen hasonlót fogunk érteni, mint az egyenletek esetében: az
egyenlőtlenség ”természetes értelmezési tartományának” azt a részhalmazát, amelynek elemei kielégı́tik az adott egyenlőtlenséget. Az egyenlőtlenség ”természetes értelmezési tartománya” pedig a valós számok halmazának az a legbővebb részhalmaza, amelyen az egyenlőtlenségben szereplő adott függvények mind értelmezve vannak Egy egyenlőtlenséget akkor tekintünk megoldottnak, ha a megoldáshalmazát feltudjuk bontani olyan páronként diszjunkt intervallumok egyesı́tésére, melyeknek végpontjait valamilyen meghatározott módon ki tudjuk számı́tani az egyenlőtlenségben szereplő adott konstansokból, függvényekből. Ez persze nem tekinthető matematikai értelemben vett precı́z definı́ciónak, inkább csak azt kı́vánjuk rögzı́teni, hogy mit szoktunk elvárni olyankor, amikor egy egyenlőtlenséget ”meg akarunk oldani”. Az egyenletek és egyenlőtlenségek
megoldási módszerei között szoros kapcsolat fedezhető fel. Ez nyilván annak a következménye, hogy például az F (x) = G(x) egyenlet megoldáshalmaza egyenlő az F (x) ≤ G(x) és G(x) ≤ F (x) egyenlőtlenségek megoldáshalmazainak metszetével. Így elvileg az utóbbi két egyenlőtlenség megoldása egyet jelent az előbbi egyenlet megoldásával, ám a valóságban a legritkább az az eset, amikor egy egyenlet megoldásait ilyen módon akarjuk meghatározni. Ennek az az oka, hogy egy egyenlőtlenségnek általában sokkal több megoldása van, sokkal bővebb a megoldáshalmaza, mint a megfelelő egyenletnek, ı́gy nem tűnik gazdaságosnak az az eljárás, hogy először nagy munkával meghatározzunk egy csomó olyan ”potenciális megoldást”, melyek nagy részéről végül úgyis kiderül, hogy nem megoldásai egyenletünknek. A     152  Egyenletek, egyenlőtlenségek  valóságban bizonyos
értelemben pont fordı́tva járunk el: az egyenlőtlenségek megoldását vezetjük vissza egyenletek megoldására. Tekintsük például a következő alap-egyenlőtlenséget: F (x) ≤ G(x) , (89) ahol F és G adott valós függvények, melyek értelmezési tartományainak metszete a D halmaz. Az alkalmazások során leggyakrabban fellépő esetekben, amikor az F és G függvények ”elég jó” tulajdonságokkal rendelkeznek az derül ki, hogy ezt a D halmazt az F (x) = G(x) egyenlet gyökei felbontják olyan páronként diszjunkt intervallumokra, amelyek mindegyikére igaz az, hogy pontjaiban az F (x) = G(x), az F (x) < G(x) és az F (x) > G(x) relációk közül pontosan egy teljesül. Tehát ha az előbbi egyenlet gyökeit meg tudjuk határozni, akkor ez a felbontás rendelkezésünkre áll, s csak ki kell válogatnunk azokat a részintervallumokat, melyeken a számunkra érdekes reláció teljesül. Ez a (89)
egyenlőtlenség esetében a D halmaz F (x) = G(x) és F (x) < G(x) tulajdonságú pontjaiból álló részintervallumok egyesı́tése lesz. Bár itt ”intervallumokra” való felbontásról beszélünk, de meg kell jegyeznünk, hogy ez természetesen nem minden esetben van ı́gy, ám mi az alábbiakban kizárólag ilyen helyzetekkel fogunk találkozni. Tehát az előző szakaszokban tárgyalt egyenletek különböző tı́pusainak megfelelően az illető egyenlethez tartozó egyes egyenlőtlenségeket általánosságban úgy próbálhatjuk megoldani, hogy az egyenlet gyökeinek megfelelően felbontjuk az értelmezési tartományt páronként diszjunkt részintervallumokra úgy, hogy ezeken az egyenlőtlenség két oldalán álló függvények különbsége állandó legyen, majd a kapott részintervallumok közül kiválogatjuk azokat, amelyek a probléma megoldása szempontjából megfelelnek. A
következőkben a fentiekben tárgyalt egyenletek mintájára röviden áttekintjük a leggyakrabban előforduló egyenlőtlenség-tı́pusokat s lehetséges megoldási módszereiket.  4.11  Lineáris egyenlőtlenségek  A 4.2 pontban a lineáris egyenletek megoldási módszerét ı́rtuk le, s most a megfelelő, lineáris egyenlőtlenségek megoldásának problematikáját tekintjük át. Ezek általános alakja F (x) ≤ G(x) , (90) ahol a ≤ jel helyett természetesen <, ≥, vagy > is szerepelhet. Megjegyezzük, hogy a későbbiekben tárgyalásra kerülő egyenlőtlenségekkel kapcsolatban is érvényes az, hogy a négy lehetséges egyenlőtlenség-jel közül bármelyik is adott a problémában, a megoldási módszerek teljesen hasonlóak, ı́gy általában csak az egyik esettel fogunk részletesen foglalkozni.     Másodfokú egyenlőtlenségek  153  A (90) egyenlőtlenségben F és G adott lineáris
függvények, s az egyenlet természetes értelmezési tartománya a valós számok halmaza. Az egyenlet mindig H(x) ≥ 0  (91)  alakra hozható, ahol H a G − F függvényt jelenti. Tehát egyenlőtlenségünk az H(x) = a x + b ≥ 0  (92)  alakot ölti, valamilyen a 6= 0 és b adott valós számokkal. A H lineáris függvény egyetlen zérushelye x0 = − ab , mely a valós számok halmazát a ]−∞, x0 [ , [x0 , x0 ] és ]x0 , +∞[ páronként diszjunkt intervallumokra bontja, melyek mindegyikén a H függvény állandó előjelű. Pozitı́v a esetén a H függvény pontosan az [x0 , +∞[= [x0 , x0 ] ∪ ]x0 , +∞[ intervallumon vesz fel nem negatı́v értékeket, ı́gy ekkor ez az egyenlőtlenség megoldáshalmaza. Negatı́v a esetén a megoldáshalmaz a ] − ∞, x0 ] intervallum Ha az egyenlőtlenségben ≥ helyett > szerepel, akkor ezekből a megoldáshalmazokból természetesen az x0 pontot ki kell hagyni, s
olyankor a megfelelő nyı́lt intervallumokat kapjuk megoldáshalmazként.  4.12  Másodfokú egyenlőtlenségek  A másodfokú egyenlőtlenségek általános alakja a x2 + b x + c ≤ 0 ,  (93)  ahol a, b, c adott valós számok, a 6= 0, illetve, természetesen a ≤ jel helyett állhat ≥, < vagy > is. Mivel a különböző egyenlőtlenség-tı́pusok kezelése teljesen hasonlóan történik, ı́gy itt most csak a fenti változattal foglalkozunk Mindenekelőtt tételezzük fel, hogy a > 0. Ekkor az x 7 a x2 +b x+c másodfokú polinom képe egy felfelé nyı́ló parabola, ami az 5 Ábrán látható x 7 x2 függvény görbéjéhez hasonló. Ha ennek a függvénynek a diszkriminánsa negatı́v, akkor a függvény csak pozitı́v értékeket vesz fel, tehát a (93) egyenlőtlenségnek nincs megoldása. Ha a diszkrimináns nulla, akkor a függvénynek egyetlen zérushelye van, egyébként pozitı́v értékeket
vesz fel, ı́gy ekkor egyenlőtlenségünknek egyetlen megoldása az illető zérushely. Végül abban az esetben, ha a diszkrimináns pozitı́v, akkor a függvénynek két zérushelye van, egyaránt felvesz pozitı́v és negatı́v értékeket, s értékei pontosan a két gyök által meghatározott zárt intervallumban nem pozitı́vak. Így ekkor a (93) egyenlőtlenség megoldásai ezen zárt intervallum pontjai. Természetesen az a < 0 esetben is a diszkrimináns értékétől függően tudjuk leı́rni az egyenlőtlenség megoldáshalmazát. Nevezetesen, ha a diszkrimináns negatı́v, vagy nulla, akkor minden valós szám megoldás, ha pedig a diszkrimináns pozitı́v, akkor a megoldáshalmaz a két gyök által meghatározott nyı́lt intervallum komplementere. A < szigorú egyenlőtlenség     154  Egyenletek, egyenlőtlenségek  esetén a másodfokú kifejezés esetleges gyökeit természetesen ki kell
zárnunk a megoldáshalmazból, végül a ≥, illetve > esetek −1-el való beszorzással az eddigi esetekre vezethetők vissza. Azt mondhatjuk tehát, hogy a (93) egyenlőtlenség, vagy ennek bármilyen változata úgy oldható meg, hogy először meghatározzuk az adott másodfokú kifejezés diszkriminánsát, illetve gyökeit, s ezek birtokában a fentieknek megfelelően le tudjuk ı́rni a megoldáshalmazt. Lássunk a fentiek alkalmazására egy egyszerű példát! Oldjuk meg a 3 x2 − 7 x + 2 > 0 egyenlőtlenséget. A másodfokú kifejezés gyökei x1 = 31 és x2 = 2, s mivel a főegyüttható pozitı́v, ı́gy az egyenlőtlenség megoldáshalmaza az [ 31 , 2] intervallum komplementere, tehát a 1 ] − ∞, [ ∪ ]2, +∞[ 3 halmaz.  4.13  Törtes egyenlőtlenségek  A különböző törtkifejezéseket tartalmazó egyenlőtlenségekkel kapcsolatban elsősorban arra kell ügyelni, hogy  ellentétben az
egyenletekkel  az egyenlőtlenségek körében nem számı́t azonos átalakı́tásnak egy egyenlőtlenség mindkét oldalának ugyanazzal a nullától különböző számmal való beszorzása. Valóban, ez csak pozitı́v számmal való szorzás után ad az eredetivel ekvivalens egyenlőtlenséget, ám ha negatı́v számmal szorzunk, akkor az egyenlőtlenség ”iránya” is megfordul. Ez természetesen csak akkor okoz problémát, ha például az a kifejezés, amivel szorzunk, maga is tartalmazza az ismeretlent, hiszen ilyenkor nem tudhatjuk, hogy a szorzó pozitı́v, vagy negatı́v. Tekintsünk például egy H(x) F (x) ≥ (94) G(x) K(x) alakú egyenlőtlenséget, ahol F, G, H, K adott valós függvények. Ennek természetes értelmezési tartománya az F, G, H, K függvények értelmezési tartományai metszetének az a része, amelyen G és K nullától különböző értékeket vesz fel. Az
egyenlőtlenség nyilván ekvivalens a következővel: F (x) H(x) − ≥ 0, G(x) K(x) illetve F (x) K(x) − H(x) G(x) ≥ 0. G(x) K(x)  (95)     Gyökös egyenlőtlenségek  155  Ezek szerint minden (94) alakú egyenlőtlenség (94) alakra hozható, ami az F (x) ≥0 G(x)  (96)  egyszerűbb alakban is felı́rható. A (96) egyenlőtlenség megoldásához vegyük figyelembe, hogy egy tört akkor és csak akkor nem negatı́v, ha számlálója nem negatı́v, nevezője pedig pozitı́v, vagy számlálója nem pozitı́v, nevezője pedig negatı́v. Így a (94) egyenlőtlenség megoldáshalmaza a következő egyenlőtlenségrendszerek megoldáshalmazainak egyesı́tése: F (x) ≥ 0 ,  és  G(x) > 0 ,  F (x) ≤ 0 ,  és  G(x) < 0 .  illetve Tekintsünk egy egyszerű példát az elmondottakra! Oldjuk meg a 2x + 3 <  16 x − 11 2x − 1  egyenlőtlenséget! Az elmondottak alapján ez ekvivalens a 16 x − 11 − 2x − 3 > 0,
2x − 1 illetve egyszerűsı́tések után az x2 − 3 x + 2 <0 2x − 1 egyenlőtlenséggel. Ez akkor és csak akkor teljesül, ha a számláló és a nevező előjele ellentétes, tehát vagy  vagy pedig  x2 − 3 x + 2 > 0  és  2x − 1 < 0,  x2 − 3 x + 2 < 0  és  2x − 1 > 0.  Eredeti egyenlőtlenségünk megoldáshalmaza tehát az iménti két egyenlőtlenségrendszer megoldáshalmazainak egyesı́tése. Az első esetben a másodfokú kifejezés nyilván a két gyök által meghatározott zárt intervallum komplementerén vesz fel pozitı́v értékeket, mı́g a lineáris kifejezés a gyöknél kisebb értékekre lesz negatı́v. Mivel ezek a gyökök a másodfokú kifejezés esetén x1 = 1 és x2 = 2, a lineáris kifejezésnél pedig x3 = 21 , ı́gy ekkor a szóbanforgó megoldáshalmaz a ] − ∞, 21 [ nyı́lt intervallum. A második esetben pont fordı́tott a helyzet: a másodfokú
kifejezés a két gyök által meghatározott nyı́lt intervallumban negatı́v, mı́g az elsőfokú polinom a gyökénél nagyobb értékekre pozitı́v. Ezek közös része az ]1, 2[ nyı́lt intervallum, tehát eredeti egyenlőtlenségünk megoldáshalmaza a 1 ] − ∞, [ ∪ ]1, 2[ 2 halmaz.     156  Egyenletek, egyenlőtlenségek  4.14  Gyökös egyenlőtlenségek  A gyökös kifejezéseket tartalmazó egyenlőtlenségek megoldása során ugyanazokat az elveket kell követnünk, amelyeket a fentiekben ismertettünk. Nevezetesen, először célszerű az egyenlőtlenségnek megfelelő egyenletet megoldani, mert szerencsés esetben a megoldások az egyenlőtlenség értelmezési tartományát olyan páronként diszjunkt intervallumokra bontják fel, amelyek mindegyikén az egyenlőtlenség két oldalán álló kifejezés állandó előjelű. Ezek után az előjelek vizsgálatával meg tudjuk határozni az
egyenlőtlenség megoldáshalmazát. Felvetődik a kérdés, hogy vajon mi a helyzet, ha az illető egyenletnek nics megoldása? Ilyenkor legtöbbször az egyenlőtlenségünk megoldáshalmaza vagy az egész értelmezési tartomány, vagy az üres halmaz, ezt a konkrét eset vizsgálatával lehet eldönteni. Hasonló a helyzet, ha az egyenlet azonosság, tehát az értelmezési tartományának minden eleme megoldás. Például, az p x2 + 1 < 0 egyenlőtlenségnek megfelelő egyenlet p x2 + 1 = 0 , amelynek nyilván nincs megoldása. Persze, könnyű látni, hogy az eredeti egyenlőtlenségnek sincs, hiszen a négyzetgyök-függvény értékei nem negatı́v valós számok. Tekintsünk most egy másik egyszerű példát! Oldjuk meg a p (x − 3)(x + 2) − 2 x < 1 egyenlőtlenséget! Először is vizsgáljuk meg az egyenlőtlenség értelmezési tartományát. Mivel a négyzetgyök alatt álló másodfokú
kifejezés csak x ≤ −2 vagy x ≥ 3 esetén nem negatı́v, ı́gy az egyenlőtlenség értelmezési tartománya a ] − ∞, −2[ ∪ ]3, +∞[ halmaz. Az egyenlőtlenségünknek megfelelő egyenlet p (x − 3)(x + 2) − 2 x = 1 ,  (97)  amelynek nincs megoldása. Ez azt jelenti, hogy az egyenlet két oldalának különbsége az értelmezési tartomány ] − ∞, −2[ és ]3, +∞[ részintervallumain állandó előjelű Valamilyen konkrét érték behelyettesı́tésével könnyen ellenőrizhetjük, hogy ez a különbség a ] − ∞, −2[ intervallumon pozitı́v, a ]3, +∞[ intervallumon pedig negatı́v, ı́gy eredeti egyenlőtlenségünk megoldáshalmaza ez utóbbi intervallum.     4.15 Exponenciális és logaritmusos egyenlőtlenségek  4.15  157  Exponenciális és logaritmusos egyenlőtlenségek  Ha egy egyenlőtlenségben az ismeretlen exponenciális függvények, vagy logaritmusfüggvények
változójában jelenik meg, akkor a megfelelő egyenletekkel kapcsolatos megoldási technikákhoz hasonló eljárásokat szoktunk alkalmazni azt is figyelembe véve, hogy az ilyen függvények szigorúan monotonak és egymás inverzei. Így például egy tipikus exponenciális egyenlőtlenség a következő: aF (x) < bG(x) ,  (98)  ahol a, b adott pozitı́v, 1-től különböző valós számok, F, G pedig adott valós függvények. A különböző alapú logaritmusok ismert átszámı́tási képlete alapján az ilyen tı́pusú egyenlőtlenségek mind aF (x) < aG(x)  (99)  alakra hozhatók, ahol tehát a adott 1-től különböző pozitı́v valós szám, F, G pedig adott valós függvények. Az egyenlőtlenség természetes értelmezési tartománya az F és G függvények értelmezési tartományainak közös része Figyelembe véve azt a tényt, hogy 0 < a < 1 esetén az a alapú
exponenciális függvény szigorúan csökken, a > 1 esetén pedig szigorúan nő, ezért a (99) egyenlőtlenség minden esetben ekvivalens az F (x) < G(x)  (100)  egyenlőtlenséggel. Teljesen hasonló megállapı́tásokat tehetünk a loga F (x) < logb G(x)  (101)  logaritmusos egyenlőtlenségekkel kapcsolatban, ahol a, b adott pozitı́v, 1-től különböző valós számok, F, G pedig adott valós függvények. Ebben az esetben azonban az egyenlőtlenség természetes értelmezési tartománya az F és G függvények értelmezési tartományai metszetének az a része, amelyen mind az F , mind a G függvények pozitı́v értékeket vesznek fel. Ettől eltekintve a megoldás menete ugyanaz: a (101) egyenlőtlenség ekvivalens a (100) egyenlőtlenséggel. Az ilyen egyenlőtlenségek természetesen a további három egyenlőtlenségjel fellépése esetén is ugyanı́gy vezethetők vissza az ismeretlent
exponenciális függvény, illetve logaritmusfüggvény változójában már nem tartalmazó egyenlőtlenségekre, amelyeket a fenti általános módszerek valamelyikével próbálhatunk megoldani. Ezekre az esetekre itt nem adunk számpéldát, hiszen az ilyen jellegű példák azonnal a korábban már ismertetett módszerek alkalmazásához vezetnének. Lássunk ugyanakkor egy valamivel összetettebb alkalmazást, amely azt illusztrálja, hogy esetenként hogyan kell a különböző módszerek alkalmas kombinációját felhasználni. Oldjuk meg a 22 x+1 − 2x+3 < 65 egyenlőtlenséget! Ez nyilván ekvivalens a 2 · (2x )2 − 8 · 2x − 65 < 0     158  Egyenletek, egyenlőtlenségek  egyenlőtlenséggel, melynek természetes értelmezési tartománya a valós számok halmaza. Az y = 2x helyettesı́téssel problémánk a 2 y 2 − 8 y − 65 < 0 alakot ölti, mely egy másodfokú egyenlőtlenség, s
megoldáshalmaza a megfelelő egyenlet gyökeitől függ. Esetünkben két gyök van: √ 8 ± 584 , y1,2 = 4 melyek közül a pozitı́v előjelű négyzetgyök esetét y1 -nek nevezve y1 > 0 és y2 < 0 teljesül. Tehát eredeti egyenlőtlenségünk megoldáshalmaza azon valós x számokból áll, amelyekre  figyelembe véve a fenti másodfokú kifejezés pozitı́v főegyütthatóját  y2 < 2x < y1 teljesül. Mivel ennek az egyenlőtlenségnek az első fele minden valós x esetén fennáll, ı́gy a megoldáshalmaz a 2x < y1 egyenlőtlenségnek eleget tevő x valós számok halmaza, ami azonos a ] − ∞ < x < log2 y1 [ intervallummal. Kalkulátorral négy tizedes jegyre számolva log2 y1 ≈ 30077 adódik, ı́gy eredeti egyenőtlenségünk megoldáshalmaza az ennél kisebb valós számok halmaza.  4.16  Trigonometrikus egyenlőtlenségek  Az olyan egyenlőtlenségek megoldásának technikája,
amelyekben az ismeretlen különböző trigonometrikus függvények változójában jelenik meg hasonló a megfelelő egyenletekéhez, figyelembe véve az egyenlőtlenségek megoldásával kapcsolatban általánosságban elhangzottakat. Az egyik leggyakrabban használható eljárás ismét az, hogy az egyenlőtlenség természetes értelmezési tartományát a megfelelő egyenlet megoldásai szerencsés esetben könnyen leı́rható, páronként diszjunkt intervallumokra bontják, s ezeken az intervallumokon az egyenlőtlenség két oldalán álló függvény előjele állandó, ı́gy az eredeti probléma megoldásai intervallumonként egy-egy konkrét számérték behelyettesı́tésével könnyen meghatározhatók. Természetesen mindig figyelemmel kell lennünk a trigonometrikus függvények sajátosságaira, periodicitásukra, s egyéb olyan jellegzetességeikre, melyek esetenként nehezı́tik, máskor
könnyı́tik a velük kapcsolatos problémák megoldását. Mivel általánosságban nehéz tárgyalni a konkrét esetekben fellépő problémákat, itt inkább két egyszerű példán igyekszünk bemutatni, hogy milyen nehézségekkel kell számolnunk, s ezek leküzdésére milyen általános, vagy egyedi módszerek használhatók. Tekintsük például a sin x < cos x egyenlőtlenséget. Az elmondottak alapján először célszerű volna megoldani a sin x = cos x     4.16 Trigonometrikus egyenlőtlenségek  159  egyenletet. Ennek természetes értelmezési tartománya a valós számok halmaza, s nyilván nincs olyan x megoldás, melyre cos x = 0 teljesülne, a trigonometrikus Pithagorasz–tétel alapján. Így az egyenlet ekvivalens a következővel: tan x =  sin x = 1, cos x  melynek összes valós megoldásai xk = π4 + k · π alakban adhatók meg, ahol k tetszőleges egész szám. Ezek a számok páronként
diszjunkt intervallumokra osztják a valós számok halmazát, melyek mindegyikén az x 7 tan x−1 függvény állandó előjelű. Az eredeti egyenlőtlenséget figyelembe véve nekünk azokat kell ezek közül kiválogatni, amelyeken ez a függvény negatı́v, s könnyű látni, hogy ezek éppen a ] π4 + 2 kπ, π4 + (2 k + 1)π[ alakú intervallumok, ı́gy eredeti egyenlőtlenségünk megoldáshalmaza ezek egyesı́tése, a k minden egész értékére. A következő példa legyen a sin x + cos2 x ≥ 2 egyenlőtlenség. Ha a cos2 x kifejezést 1 − sin2 x-szel helyettesı́tjük, akkor az y = sin x új ismeretlen bevezetésével egy másodfokú egyenlőtlenséget kapunk, amelyet a fentiekben ismertetett módszerekkel könnyen meg tudunk oldani. Ám egy egyszerű észrevétel segı́tségével jelentősen egyszerűsı́thetjük és gyorsı́thatjuk a megoldás menetét. Nevezetesen, a nyilvánvaló sin x ≤ 1 és
cos2 x ≤ 1 egyenlőtlenség alapján minden valós x-re fennáll a sin x + cos2 x ≤ 2 egyenlőtlenség, ami az eredeti egyenlőtlenségünk megoldáshalmazának minden x elemére azt jelenti, hogy valójában a sin x + cos2 x = 2 egyenlőséget is teljesı́ti. Ez viszont csak úgy lehet, ha sin x = 1 és cos2 x = 1 egyidejűleg fennáll, ami lehetetlen, például a trigonometrikus Pithagorasz–tétel miatt. Így eredeti egyenlőtlenségünknek nincs megoldása