arithmétique flottante

(Cliquez-ici pour accéder à la version originale de cette discussion avec couleurs et images)







Posted by: legeniedesalpages

Bonjour,

j'ai du mal avec cet exercice:

Citation:
On note \mathbb{F}(2,8,23) l'ensemble des flottants en base 2 avec un exposant (en base 2) à 8 bits (décimales binaires) et une mantisse à 23 bits.

Donc cet ensemble correspond au format IEEE à 32 bits (simple précision).

Préciser, le plus petit flottant \varepsilon>0 tel que 1+\varepsilon>1 puis comment trouver la distance entre deux flottants successifs.


Je sais bien que 3$\varepsilon=\frac{1}{2^{23}}, mais je ne vois pas comment le montrer.

Ensuite, pour déterminer la distance entre deux flottants successifs, je n'ai aucune idée de comment procéder.

Merci pour votre aide.



Posted by: ThSQ

Doit manquer le bit de signe non ?

Plus sérieux, l'écart entre deux flottants succéssifs est augmenté d'un facteur 2 tous les 2^23.



Posted by: Imod

Désolé si l'humour est un peu lourd , mais là , je coule

Imod



Posted by: ThSQ

Citation:
Posté par Imod
Désolé si l'humour est un peu lourd , mais là , je coule

Imod


(j'ai pas compris Imod, chuis un peu naze là faut dire)



Posted by: Imod

Citation:
Posté par ThSQ
(j'ai pas compris Imod, chuis un peu naze là faut dire)

Tout ce qui ne flotte pas ...

Imod



Posted by: ThSQ

Citation:
Posté par Imod
Tout ce qui ne flotte pas ...


'tin trop fort
J'y étais pas là ....



Posted by: legeniedesalpages

ah oui effectivement,

j'ai trouvé ça aussi en allant au boulot, merci.



Posted by: Imod

Citation:
Posté par legeniedesalpages
ah oui effectivement, j'ai trouvé ça aussi en allant au boulot, merci.

Bon , j'annonçais la couleur au départ ( un peu lourd ) , je ne sais pas si le problème est compliqué mais le jargon me dépasse : je vous laisse travailler

Imod



Posted by: legeniedesalpages

là, je ne comprends pas vraiment comment il faut procéder:

On considère l'ensemble des flottants \mathbb{F}(2,p,q), où donc l'exposant est à p bits, et la mantisse à q bits.

On note fl(x) la projection par arrondi sur \mathbb{F}(2,p,q) de x\in [-\varphi_M,-\varphi_m]\cup [\varphi_m,\varphi_M].

"Montrer" que 3$\frac{|fl(x)-x|}{|x|}\leq \frac{1}{2} 2^{1-q}.

Edit: \varphi_m est le plus petit flottant (en valeur absolue), et \varphi_M est le plus grand flottant.



Posted by: legeniedesalpages

je vois pas la feinte pour la démo.

Je vois pas bien que |fl(x)-x|\leq \frac{1}{2} 2^{q-1}, mais après lorsqu'on divise par |x|, je vois pas.



Posted by: legeniedesalpages

ah oui pardon, j'ai oublié de préciser que \varphi_m est le plus petit flottant (en valeur absolue), et \varphi_M est le plus grand flottant.





Posted by: legeniedesalpages

Si x\in ([-\varphi_M,-\varphi_m]\cup [-\varphi_m,-\varphi_M])\setminus ]-1,1[:

|x|\geq 1, donc \frac{1}{|x|} \leq 1.

D'autre part 3$|fl(x)-x|\leq \frac{1}{2^q} = \frac{1}{2} 2^{q-1}.

Donc 3$\frac{|fl(x)-x|}{|x|} \leq \frac{1}{2} 2^{q-1}.

Reste le cas où x\in ([-\varphi_M,-\varphi_m]\cup [-\varphi_m,-\varphi_M])\cap ]-1,1[ où j'ai du mal.



Posted by: legeniedesalpages

un petit up











-