OPERATORI
. 1. Generalità. - Il termine o. indica d'ordinario il simbolo d'una operazione, o più in generale d'una applicazione univoca (v. applicazione, in questa App.); per una seconda accezione, proposta da J. Mikusiński, rinviamo al punto 5.
a) In un certo ambiente siano dati un elemento ω e un insieme A (non vuoto), ì cui elementi chiameremo oggetti; si dice che ω è un operatore definito in A, quando a ω è associata un'applicazione univoca di A in sé; dato un oggetto a, la sua immagine in tale applicazione si indica con ωa, e si dice ottenuta applicando l'operatore ω all'oggetto a.
Esempio. - Il segno ″ − ″ è da considerare un operatore definito nell'insieme R dei numeri reali, se ad esso si associa l'applicazione x → − x(x ∈ R).
b) La definizione precedente si può generalizzare, pensando d'associare a ω un'applicazione univoca di A × A (totalità delle coppie ordinate d'oggetti), ovvero di A × A × A (totalità delle terne ordinate di oggetti),..., in A; si dirà allora che ω è un operatore a due termini (binario), ovvero a tre termini (ternario), ..., rispettivamente, definito in A. Per omogeneità di nomenclatura, gli operatori introdotti in a) son da dirsi a un termine (unarî), mentre è opportuno considerare ω come operatore a zero termini (nullario) se ad esso si associa semplicemente un elemento di A.
Esempio. - Il segno ″ + ″ è da considerare un operatore binario, definito nell'insieme R dei numeri reali, se ad esso si associa l'applicazione (x,y) → x + y (x,y ∈ R); analogamente, il segno ″ − ″ può considerarsi un operatore binario.
c) Più in generale, dati gli insiemi (non vuoti) A1, A2, ..., si può pensare d'associare a ω un'applicazione univoca di A1, ovvero di A1 × A2 (totalità delle coppie composte d'un elemento di A1 e di un elemento di A2), ovvero di A1 × A2 × A3 (totalità delle terne composte d'un elemento di A1, uno di A2, uno di A3), ..., in A; diremo ancora che ω è un operatore unario, ovvero binario, ovvero ternario, ... dall'insieme A1, ovvero A1 × A2, ovvero A1 × A2 × A3, ..., rispettivamente, nell'insieme A.
Esempio. - Siano: A l'insieme dei numeri reali; A1, l'insieme dei numeri reali positivi; A2 l'insieme dei numeri reali, positivi e diversi da 1. Il segno ″ log ″ va considerato come un operatore binario da A1 × A2 in A, ad esso essendo associata l'applicazione (x,y) → logyx (x ∈ A1, y ∈ A2).
Con ciò è chiarito in che senso un operatore sia il nome di una applicazione; la coerenza vieta di indicare con lo stesso nome cose diverse, ma permette di dare alla stessa cosa nomi diversi; così in generale operatori diversi potrebbero essere associati alla stessa applicazione. Ad es., se A1 è l'insieme delle successioni crescenti e limitate di numeri reali, i due operatori "lim" e "sup" (rispettivamente "limite" ed "estremo superiore") corrispondono a una stessa applicazione di A1 nell'insieme dei numeri reali, com'è noto dagli elementi della Analisi. Un insieme Φ di operatori si dice assoluto, quando accade che ad operatori diversi (∈ Φ) corrispondano sempre applicazioni diverse: se ciò non accade, s'introduce in Φ una nozione d'eguaglianza astratta (equivalenza), scrivendo ω1 = ω2 per indicare che le due applicazioni a → ω1a e a → ω2a (a ∈ A) coincidono (ω1, ω2 ∈ Φ).
Aggiungiamo ancora che un'applicazione associata a un operatore unario, binario, ternario, ..., si chiama anche operazione unaria, binaria, ternaria, ..., rispettivamente; in modo analogo, i singoli oggetti vanno considerati come operazioni nullarie.
2. Struttura di un insieme di operatori. - Un insieme di operatori potrà essere dotato di una struttura inerente al modo con cui è stato definito, ovvero anche indotta dalla eventuale struttura di cui sia dotato l'insieme degli oggetti. Limitiamoci per semplicità a considerare operatori unarî.
a) Detto Φ un insieme di operatori definiti nell'insieme A di oggetti, consideriamo l'insieme Ω così definito: I) 1εΩ; II) ΦεΩ; III) se ω1εΩ e ω2εΩ, allora anche ω1ω2εΩ; IV) con le regole I), II), III), si ottengono tutti gli elementi di Ω. A ciascun elemento di Ω associamo una applicazione univoca di A in sé al modo seguente: I′) ad 1 associamo l'applicazione identica a → a ; II′) se ωεΩ, ad ω associamo l'applicazione (già nota) a → ωa; III′) se ω1 εΩ e ω2εΩ, a ω1ω2 associamo la applicazione a → ω1 (ω2 a) (aεA). Se a ciascun elemento di Ω risulta associata, in virtù delle I′) II′), III′), una sola applicazione di A in sé, Ω risulta un insieme di operatori definiti in A, dotato della struttura di un semigruppo con unità; l'operatore ω1ω2 si dice prodotto degli operatori ω1, e ω2, nell'ordine, e questi si dicono permutabili nel caso che sia ω1ω2 = ω2ω1; l'operatore ωω ...ω (k volte) si abbrevia anche in ωk, e per convenzione si pone ω0 = 1.
Esempio. - Sia A l'insieme delle funzioni reali delle due variabili reali x e y, indefinitamente derivabili, sia Φ l'insieme {δ/δx, δ/δy}, dove a δ/δx si associ l'applicazione f → δf/δx, a δ/δy l'applicazione f → δf/δy (f ε A); l'insieme Ω risulta un semigruppo commutativo (teor. di I. Schwartz) dotato di unità, gli elementi del quale sono, a meno d'eguaglianze, δh+k/δxhδyk (h,k = 0, 1, 2,...).
b) Sia ancora Φ un insieme di operatori definiti nell'insieme A di oggetti, e supponiamo che, per ogni ωεΦ, l'applicazione a →ωα (aεA) sia su A (e non solo in A) e biunivoca (e non solo univoca); definiamo ora l'insieme Ω come in a), leggendo però "se ωεΦ, allora ωεΦ e ω-1εΩ" in luogo della (II), e "se ωεΦ, ad ω associamo l'applicazione (già nota) a →ωα, ad ω-1 l'applicazione inversa ωa →a (aεA)" in luogo della II′). Se a ciascun elemento di Ω risulta associata, in virtù delle I′), II′), III′) così modificate, una sola applicazione di A in sé, Ω risulta un insieme di operatori definiti in A, dotato della struttura di un gruppo, in genere non commutativo. L'operatore (ω-1)k si abbrevia anche in ω-k.
Esempio. - Sia A l'insieme delle funzioni reali indefinitamente derivabili su tutto l'asse reale, nulle nell'origine con tutte le loro derivate; l'insieme Ω sia costituito dal solo elemento D, cui associamo l'applicazione f → df/dx (f ε A). L'insieme Ω risulta un gruppo abeliano, i cui elementi, prescindendo da eguaglianze, sono 1, Dk, D-k (k = 1,2,...): all'operatore Dk è associata la applicazione f → dkf/dxk, all'operatore D-k l'applicazione
c) Siano ora A e B due insiemi (non vuoti), e Ω un insieme di operatori unarî da A in B; esaminiamo come la eventuale struttura in B si rifletta sulla struttura di Ω.
In primo luogo, se R è una relazione unaria [binaria, ternaria, ...] definita in B, diremo che si ha Rω1 [R(ω1, ω2), R(ω1, ω2, ω3), ...] quando per ogni aεA si ha R(ω1a) [R(ω1a, ω2a), R(ω1a, ω2a, ω3a), ...] (ω1, ω2, ω3, ... εΦ). In tal modo in Φ risultano definite relazioni omologhe a quelle definite in B; si noti che la relazione d'eguaglianza tra operatori, introdotta alla fine del punto 1, è proprio quella che nel modo qui indicato si deduce dalla relazione di eguaglianza tra elementi di B.
In secondo luogo, consideriamo l'insieme Ω così definito I): Φ ⊂ Ω; II) se è un operatore nullario (unario, binario, ...) definito in B ed appartenente alla struttura di B, allora è τεΩ[τ(ω1) εΩ, τ(ω1, ω2)εΩ, ..., rispettivamente, per ogni ω1, ω2, ... εΩ]; III) con le regole I) e II) si ottengono tutti gli elementi di Ω. A ciascun elemento di Ω associamo un'applicazione di A in B al modo seguente: I′) se ωεΦ, a ω si associa l'applicazione già nota a → ωa; II′) se τ è un operatore nullario [unario, binario, ...] appartenente alla struttura di B, allora a τ[a τ(ω1), a τ(ω1, ω2), ..., quali che siano ω1, ω2, ... εΩ] si associa l'elemento τ [l'applicazione a → τ(ω1a), l'applicazione a → τ(ω1a, ω2a), ..., rispettivamente]. Se a ciascun elemento di Ω risulta associata, in virtù delle I′), II′), una sola applicazione di A in B, Ω risulta un insieme di operatori unarî da A in B, nel quale son definite operazioni e relazioni omologhe a quelle appartenenti alla struttura di B; inoltre, se in Ω si trova l'operatore 1, ogni operatore unario appartenente alla struttura di B risulta eguale a tlualche operatore appartenente ad Ω.
Esempio. - Sia A un intervallo dell'asse reale, B l'asse reale, Φ l'insieme delle funzioni reali definite in A; per f,g ε Φ, f + g indica l'applicazione x → f(x)+g(x), f • g l'applicazione x f(x)•g(x), mentre la f ≤ g significa che, per ogni x ε A, si ha f(x) ≤ g(x). Poiché B è un reticolo rispetto alla relazione ≤, ed è un gruppo abeliano rispetto alla operazione +, altrettanto accade per Φ.
È chiaro che, se Φ è un insieme di operatori unarî definiti in un insieme A di oggetti dotato d'una certa struttura, allora, mettendo assieme le costruzioni a) e c) [eventualmente b)], si ottiene un insieme Ω di operatori definiti in A, il quale include tutti gli operatori unarî della struttura di A, è dotato d'una struttura analoga a quella di A, ed è inoltre un semigruppo con unità [eventualmente un gruppo]. Su questo fatto si basa la possibilità di istituire un vero e proprio calcolo degli operatori, largamente usato in rami svariati della matematica.
Esempio. - Sia A l'insieme delle funzioni reali delle due variabili reali x e y, indefinitamente derivabili in tutto il piano; sia Ω l'insieme {δ/δx, δ/δy}, essendo associata a δ/δx l'applicazione f → δf/δx, a δ/δy l'applicazione f → δf/δy. Essendo A una varietà lineare sul corpo R dei numeri reali, per quanto ora esposto, per il teorema di I. Schwartz e per la distributività della derivazione, Ω risulta un anello commutativo isomorfo all'anello dei polinomi in due indeterminate sul corpo R. Di qui è immediato che, ponendo
Tra gli elementi di Ω si trovano ad es. l'operatore di Laplace δ2/δx2 + δ2/δy2, quello di D'Alembert δ2/δx2 − δ2/δy2, ecc.
d) Siano ora A e B due insiemi dotati d'un certo tipo di struttura; un operatore unario ω da A in B si dice compatibile con tale tipo di struttura quando, detti R e τ risp. una relazione ed un operatore appartenenti ad esso, si ha: I) dalla Ra1[R(a1, a2), R(a1, a2, a3) ...] segue R(ωa1) [R(ωa1, ωa2), R(ωa1, ωa2, ωa3), ..., rispettivamente]; II) τ(ωa1) = ω(τa1), τ(ωa1, ωa2) = ω[τ(a1, a2], τ(ωa1, ωa2, ωa3) = ω[τ(a1, a2, a3)], ... (akεA; k = 1, 2, 3, ...).
Esempí. - Così la proprietà distributiva d'un operatore altro non è che la sua compatibilità con la struttura di varietà lineare; la continuità altro non è che la compatibilità con la struttura di convergenza; ecc.
3. Operatori e funzionali lineari. - Una grande importanza ha assunto nella matematica contemporanea lo studio di quegli operatori che sono compatibili con una struttura di varietà lineare (operatori lineari), ed eventualmente anche con una struttura di convergenza (operatori lineari continui); questo, sia per la intrinseca bellezza della teoria (Algebra o, rispettivamente Analisi, lineare), sia perché molti problemi della fisica matematica possono tradursi nella discussione dell'esistenza di operatori lineari verificanti certe condizioni.
a) Sia A un insieme di elementi che chiameremo vettori, Γ un corpo numerico i cui elementi chiameremo scalari; si dirà che A è una varietà lineare sul corpo Γ quando I) è assegnato in A un vettore da dirsi nullo, O; II) è assegnata una applicazione univoca di A × A in A, commutativa ed associativa, da dirsi somma; III) è assegnata una applicazione univoca di Γ × A, in A, distributiva in entrambi i sensi rispetto alla somma ed associativa, da dirsi prodotto; IV) si ha 1 • a = a, 0 • a = O per ogni aεA.
Ciò premesso, date due varietà lineari A e B sullo stesso corpo numerico Γ, un operatore unario ω da A in B si dice lineare, quando si ha ω(γ1a1 + γ2a2) = γ1(ωa1) + γ2(ωa2) per ogni γ1, γ2εΓ e a1, a2εA; nel caso particolare che sia B = Γ, invece di dire operatore lineare da A in Γ, si dice di solito funzionale lineare di A.
Esempî. - L'insieme A delle funzioni reali di due variabili reali, indefinitamente derivabili in tutto il piano, è un esempio di varietà lineare sul corpo dei numeri reali; l'insieme -.t introdotto nel penultimo esempio del punto 2) è un insieme di operatori lineari da A in A.
b) Date due varietà lineari A e B, nelle quali sia stata introdotta una nozione di convergenza e di limite (per successioni o, più in generale, per famiglie dirette nel senso di Moore-Smith-Picone), si dirà che l'operatore ω da A in B è continuo quando, ogni qualvolta si verifica l'eguaglianza a = limi ai, si verifica di conseguenza l'eguaglianza ωa = limi (ωai) (a, aiεA; {ai} successione ovvero famiglia diretta d'elementi). Queste nozioni di convergenza, limite, continuità permettono poi di introdurre in modo naturale le altre due operazioni fondamentali dell'Analisi Matematica, la derivazione e l'integrazione, per operatori dipendenti da un parametro variabile nel corpo Γ; così pure si introduce spontaneamente la nozione di convergenza e di somma per una serie di operatori lineari.
Tra le varietà lineari in cui sia definita una nozione di convergenza e di limite, le più notevoli sono gli spazî di Banach, di Hilbert, di Kantorovič(Riesz), per i quali rinviamo alla bibliografia, limitandoci qui ad accennare che: I) in uno spazio di Kantorovič è definita una relazione d'ordine (parziale), in virtù della quale lo spazio stesso risulta un reticolo completo, e rispetto alla quale la somma tra due vettori e il prodotto tra uno scalare e un vettore risultano operazioni monotone (Γ è il corpo reale); II) in uno spazio di Banach è definita una funzione reale ∥ a ∥ ("norma di a") di vettore, verificante le condizioni:∥ O ∥ = 0, ∥ a ∥ > 0 per a ≠ O, ∥ a′ + a″ ∥ ≤ ∥ a′ ∥ + ∥ a″ ∥, ∥ γa ∥ = ∣ γ ∣ • ∥ a ∥ (a, a′, a″ vettori; γ scalare), in virtù delle quali, se si chiama distanza tra i vettori a′ e a″ la quantità ∥ a′ − a″ ∥, lo spazio di Banach stesso risulta uno spazio metrico (Γ è il corpo reale od il corpo complesso); III) in uno spazio di Hilbert è definita una operazione di prodotto scalare 〈a′, a″> tra due vettori a′, a″, distributiva rispetto al primo termine a′, avente per risultato uno scalare, verificante inoltre le condizioni:
(Γ è il corpo reale od il corp0 complesso); se si pone ∥ a ∥ =
lo spazio di Hilbert si rivela come caso particolare di spazio di Banach.
c) Fondamentale, in questa teoria, il problema della inversione di un operatore lineare, ossia quello di discutere l'equazione ωa = b nella incognita a, da cercare in una varíetà lineare A, dove b è un assegnato vettore d'una varietà lineare B, ed ω è un assegnato operatore lineare da A in B (A e B lineari sullo stesso corpo), sussistono in proposito teoremi che generalizzano quelli di Cramer e di Rouché. Un notevole risultato è il seguente: se A e B sono due spazî completi di Banach ed ω è un operatore lineare continuo da A in B univocamente invertibile (ossia è associato ad una applicazione biunivoca di A su B), anche l'operatore inverso ω-1 (associato all'applicazione inversa ωa → a) è lineare e continuo. Grande importanza hanno pure teoremi di rappresentazione, che permetto1io di dare definizioni costruttive per gli operatori lineari continui da una varietà lineare in un'altra, e teoremi di struttura, che descrivono la struttura (di varietà lineare, di spazio di Banach, di Kantorovič, ecc.) della totalità degli operatori lineari continni da una varietà lineare in un'altra.
d) In particolare, sia Ω la totalità degli operatori lineari continui (considerando due operatori eguali come coincidenti) da uno spazio completo di Banach A in sé stesso, il corpo degli scalari essendo il corpo Γ dei numeri complessi; per uno dei teoremi di struttura suaccennati, Ω risulta un'algebra (algebra di Banach), includente Γ come sottoalgebra.
Si dice spettro di un operatore ω ε Ω l'insieme dei valori complessi z per i quali l'operatore ω − z (pure ε Ω) non è dotato d'inverso entro l'algebra Ω: questo spettro è un insieme S(ω) chiuso e limitato, non vuoto, del piano di Gauss, e il suo studio è di grande interesse per la caratterizzazione dell'operatore ω; tra l'altro esso consente di introdurre la nozione di funzione analitica d'operatore in modo coerente con le operazioni dell'algebra Ω. Sia f(z) una funzione complessa della variabile complessa z, olomorfa localmente in un campo G del piano di Gauss; dato ω ε Ω, con S(ω) ⊂ G, si pone
dove T è un dominio contenuto in G e contenente S(ω) nell'interno, e FT è composto d'un numero finito di curve semplici e rettificabili; il valore f(ω) così definito appartiene ancora ad Ω e non dipende dalla scelta di T; se ω si riduce ad essere un numero complesso, S(ω) si riduce all'unico numero ω, e la [1] si riduce all'enunciato del teorema di Cauchy per le funzioni analitiche.
e) Tra gli operatori lineari da una varietà lineare A in sé stessa, hanno interesse i cosiddetti proiettori, ossia gli operatori ω verificanti la condizione (di idempotenza) ω2 = ω, mediante i quali si possono dare notevoli teoremi di rappresentazione per diverse classi di operatori lineari. Se A è uno spazio di Banach, generalmente si considerano solo proiettori continui; se A è uno spazio di Hilbert, si considerano solo proiettori continui autoaggiunti [tali, cioè, da aversi 〈ωa, b> = 〈a, ωb>; la loro totalità è un reticolo completo, di cui l'operatore 0 e l'operatore 1 sono rispettivamente il minimo e il massimo]; se A è uno spazio di Kantorovič, si considerano solo proiettori continui non negativi [tali, cioè, da aversi ωa ≤ o per a ≤ 0; la loro totalità costituisce un'algebra completa di Boole, di cui gli operatori 0 ed 1 rappresentano rispettivamente il minimo ed il massimo].
4. Le distribuzioni di L. Schwartz. - Sia A la totalità delle funzioni complesse di variabile reale, indefinitamente derivabili su tutto l'asse reale, ciascuna delle quali nulla in un intorno dell'infinito; è chiaro che A è una varietà lineare sul corpo Γ dei numeri complessi. In A introduciamo una struttura di convergenza, scrivendo
per dire che: I) all'esterno d'un opportuno intervallo limitato, tutte le funzioni a, an sono identcamente nulle; II) nell'intervallo detto, ciascuna delle successioni
converge uniformemente a zero (k = 0, 1, 2,...). Ciò premesso, una distribuzione di Schwartz non è altro che un funzionale lineare continuo, definito in A. Qualunque funzione complessa f(x) di variabile reale, che sia quasi continua e localmente sommabile sull'asse reale, può esser considerata come una distribuzione, associandosi ad essa l'applicazione da A in Γ:
analogamente, qualunque misura μ di Stieltjes può esser pensata come una distribuzione, associandosi ad essa l'applicazione
È ovvio che la totalità &out;d elle distribuzioni è una varietà lineare sul corpo Γ; ma l'interesse della teoria sta nella possibilità di definire una operazione di derivazione e una di integrazione indefinita per qualunque distribuzione, in modo coerente con le definizioni consuete e compatibile con una struttura di convergenza che "naturalmente" s'introduce in &out;d. Precisamente, se ω è una distribuzione data, anche dω/dx si definisce come distribuzione associando ad essa l'applicazione a → − ω[da/dx] (aεA); l'integrazione indefinita si definisce, al solito, come operazione inversa della derivazione. Naturalmente, anziché partire da un insieme A di funzioni di una variabile reale, si può partire da un insieme di funzioni d'un numero qualsiasi di variabili reali, definire le distribuzioni "di più variabili" e le loro "derivate parziali". Questa teoria ha trovato applicazione nello studio delle equazioni differenziali, dove è spesso conveniente ed anche più significativo cercar soluzioni che siano derivabili anche solo in un senso "generalizzato".
5. Operatori di Mikusiński. - Completamente diverso è il senso del termine o. secondo J. Mikusiński e la sua scuola. Sia A l'insieme di tutte le funzioni complesse della variabile reale t, continue a tratti su tutto l'asse reale, ciascuna delle quali nulla in un intorno di − ∞; nell'insieme A si introduce una struttura di anello commutativo, di caratteristica zero, privo di unità, definendo la somma + e il prodotto al modo seguente
Il Mikusiński chiama operatori gli elementi del corpo commutativo generato dall'anello A, ossia le frazioni del tipo a/b, i cui termini a e b sono elementi di A (il secondo diverso dalla funzione identicamente nulla), con l'intesa di considerare eguali le due frazioni a′/b′ e a″/b″ quando è a′* b″ = a″*b′, e definendo al modo consueto le operazioni aritmetiche sulle frazioni. Servendosi di questo corpo di operatori, il Mikusiński dà una fondazione rigorosa ai metodi del calcolo simbolico, senza far uso di trasformazioni integrali (vedi simbolico, calcolo, in questa App.).
Bibl.: Sul concetto di operatore, v. N. Bourbaki, Les structures générales de l'analyse, libro I, Parigi 1939, o anche H. Curry e R. Feys, Combinatory logic, Amsterdam 1958. Sugli operatori lineari in generale si legga, per un orientamento a grandi linee: Mahlon M. Day, Normed linear spaces, Berlino 1958, e per uno studio approfondito: N. Dunford e J. Schwartz, Linear operators, New York 1958; M. A. Neumark, Normierte Algebren, Berlino 1959; A.C. Zaanen, Linear analysis, Amsterdam 1953. In particolare sugli spazî di Kantorovic si legga: L.V. Kantorovič, B. Z. Vulih, e A. G. Pinsker, Funkcional'nyj Analiz v Poluuporjadočennyh Prostranstvah, Mosca-Leningrado 1950; sugli spazî di Hilbert cfr.: N. I. Achieser e I. M. Glasmann, Theorie der linearen Operatoren im Hilbert Raum, Berlino 1954; sugli spazî di Banach lo stesso S. Banach, Théorie des opérations linéaires, Varsavia 1932; in italiano si consulti: G. Fichera, Trasformazioni lineari, Trieste 1954. Sulla teoria delle distribuzioni, si veda: L. Schwartz, Théorie des distributions, Parigi 1951; sul calcolo operatorio di J. Mikusiński, infine, si lega: J. Mikusiński, Operational Calculus, Varsavia 1959.